Pandas 특정 문자 추출 - Pandas teugjeong munja chuchul

Step 1.  pandas 패키지 import

import pandas as pd

pandas를 import 해줍니다. 설치가 안 되어 있는 분은 터미널(커맨드라인)에 아래 명령어를 입력하셔서 pandas를 설치해 주세요.

$ pip install pandas

Step 2.  데이터프레임 세팅

dt = pd.DataFrame({'이름': ['성기훈', '조상우', '장덕수', '오일남', '한미녀'],                    '주소': ['서울시 도봉구 쌍문동',                            '서울시 종로구 혜화동',                            '서울시 강남구 삼성동',                            '서울시 강남구 논현동',                            '서울시 강남구 논현동']})

예제를 위한 데이터프레임을 세팅했습니다.

dt.head()

데이터프레임을 조회하면 아래와 같습니다.

Step 3.  Series.str.contains('찾을 문자열')

위의 데이터프레임 예시처럼 주소 정보가 주어질 때, 특정 구나 동에 거주하는 사람들만 조회하고 싶다면 어떻게 해야 할까요? 이럴 때 사용하는것이 데이터프레임의 내장 함수인 str.contains()입니다. 사용방법을 예시와 함께 살펴보죠.

예제1) 종로구 거주자 조회

예제로 종로구에 거주하는 사람의 정보를 조회해 보겠습니다.

# 종로구 거주자 찾기 dt['주소'].str.contains('종로구')

사용방법은 간단합니다. 키워드를 조회할 특정 열(column)에 str.contains 구문 내 키워드를 입력해 주면 됩니다.

위👆👆👆와 같이 bool 데이터를 갖는 Series가 반환되는 것을 확인할 수 있습니다. 그렇다면 원본 데이터프레임의 형태로 특정 키워드를 포함한 데이터는 어떻게 조회할 수 있을까요?

# 종로구 거주자 찾기 dt[dt['주소'].str.contains('종로구')]

위와 같이 코드를 작성하면 str.contains() 함수를 통해 반환된 값 중 True에 해당되는 행(row) 데이터만 조회할 수 있습니다.

포스팅 내용에 오류가 있다면 아래에 👇👇👇 댓글 남겨주시면 감사드리겠습니다.
그럼 오늘도 즐거운 하루 보내시길 바랍니다.
고맙습니다 :)

Programming Blog

검색하기 Search

Programming Blog

Go-ong

  • 분류 전체보기 (54)
    • 라즈베리파이 (3)
    • 리눅스 (2)
    • C (1)
    • C# (2)
    • JAVA (0)
    • 한큐에 자바 (3)
    • Python (18)
      • Django (4)
      • Postgresql (1)
    • Node js (11)
      • 생활 코딩 Node js (11)
    • Java Script (0)
    • HTML (0)
    • CSS (0)
    • SQLD 정리 (4)
    • 빅데이터 분석 (8)
      • 분석 기법 (2)
      • 웹 크롤링 (0)
      • Pandas (6)
    • 머신러닝 (1)
      • 데이터 전처리 (1)
    • 정규표현식 (0)

Guestbook

Notice

    Recent Posts

    • 중복 데이터 처리
    • 특정 행 또는 열을 대상으로 결측값 있으면 제거
    • 특정 문자 포함하는 행 추출
    • Python 정규표현식 사용 List

    Recent Comments

    • Dask는 기본적으로 앞으로 어떤 처리를 할 것이다 라⋯

    Link

      «   2022/12   »

      일월화수목금토
      1 2 3
      4 5 6 7 8 9 10
      11 12 13 14 15 16 17
      18 19 20 21 22 23 24
      25 26 27 28 29 30 31

      Tags

      • SQLD
      • 머신러닝
      • 명령어
      • PARTITION BY
      • CROSS JOIN
      • 원핫인코딩
      • 사이킷런
      • partition
      • SQL
      • Python
      • ML
      • Machine Learning
      • sklearn
      • 기본
      • 레이블 인코딩
      • django
      • Cartesina Product
      • data preprocessing

      more

      Archives

      • 2021/09 (4)
      • 2021/05 (5)
      • 2020/11 (10)
      • 2020/10 (1)

      Today10Total10,881

      관리 메뉴

      • 글쓰기
      • 방명록
      • RSS
      • 관리

      Programming Blog

      특정 문자 포함하는 행 추출 본문

      빅데이터 분석/Pandas

      특정 문자 포함하는 행 추출

      Go-ong 2021. 9. 30. 11:12

      df = df[df['Column Name'].str.contains('condition text')]

      Column Name : 컬럼명

      condition text : 특정 문자

      '빅데이터 분석 > Pandas' 카테고리의 다른 글

      중복 데이터 처리  (0)특정 행 또는 열을 대상으로 결측값 있으면 제거  (0)(pandas) DataFrame 합치기  (0)(Pandas) read_csv파일 encoding Error  (0)pandas 대용량 csv 파일 읽기 - dask  (1)
      2021.09.30
      2021.09.30
      2020.11.12
      2020.11.12
      2020.11.12

      '빅데이터 분석/Pandas' Related Articles

      • 중복 데이터 처리 2021.09.30
      • 특정 행 또는 열을 대상으로 결측값 있으면 제거 2021.09.30
      • (pandas) DataFrame 합치기 2020.11.12
      • (Pandas) read_csv파일 encoding Error 2020.11.12

      more

      0 Comments

        댓글쓰기 폼

        이름 비밀번호

        Secret

        내용

        Blog is powered by kakao / Designed by Tistory

        Toplist

        최신 우편물

        태그