Pandas 특정 문자 추출 - Pandas teugjeong munja chuchul

Step 1.  pandas 패키지 import

import pandas as pd

pandas를 import 해줍니다. 설치가 안 되어 있는 분은 터미널(커맨드라인)에 아래 명령어를 입력하셔서 pandas를 설치해 주세요.

$ pip install pandas

Step 2.  데이터프레임 세팅

dt = pd.DataFrame({'이름': ['성기훈', '조상우', '장덕수', '오일남', '한미녀'], 
                   '주소': ['서울시 도봉구 쌍문동',
                           '서울시 종로구 혜화동',
                           '서울시 강남구 삼성동',
                           '서울시 강남구 논현동',
                           '서울시 강남구 논현동']})

예제를 위한 데이터프레임을 세팅했습니다.

dt.head()

데이터프레임을 조회하면 아래와 같습니다.

Pandas 특정 문자 추출 - Pandas teugjeong munja chuchul

Step 3.  Series.str.contains('찾을 문자열')

위의 데이터프레임 예시처럼 주소 정보가 주어질 때, 특정 구나 동에 거주하는 사람들만 조회하고 싶다면 어떻게 해야 할까요? 이럴 때 사용하는것이 데이터프레임의 내장 함수인 str.contains()입니다. 사용방법을 예시와 함께 살펴보죠.

예제1) 종로구 거주자 조회

예제로 종로구에 거주하는 사람의 정보를 조회해 보겠습니다.

# 종로구 거주자 찾기
dt['주소'].str.contains('종로구')

사용방법은 간단합니다. 키워드를 조회할 특정 열(column)에 str.contains 구문 내 키워드를 입력해 주면 됩니다.

Pandas 특정 문자 추출 - Pandas teugjeong munja chuchul

위👆👆👆와 같이 bool 데이터를 갖는 Series가 반환되는 것을 확인할 수 있습니다. 그렇다면 원본 데이터프레임의 형태로 특정 키워드를 포함한 데이터는 어떻게 조회할 수 있을까요?

# 종로구 거주자 찾기
dt[dt['주소'].str.contains('종로구')]

위와 같이 코드를 작성하면 str.contains() 함수를 통해 반환된 값 중 True에 해당되는 행(row) 데이터만 조회할 수 있습니다.

Pandas 특정 문자 추출 - Pandas teugjeong munja chuchul

포스팅 내용에 오류가 있다면 아래에 👇👇👇 댓글 남겨주시면 감사드리겠습니다.
그럼 오늘도 즐거운 하루 보내시길 바랍니다.
고맙습니다 :)

Programming Blog

검색하기 Search

Programming Blog

Go-ong


  • 분류 전체보기 (54)
    • 라즈베리파이 (3)
    • 리눅스 (2)
    • C (1)
    • C# (2)
    • JAVA (0)
    • 한큐에 자바 (3)
    • Python (18)
      • Django (4)
      • Postgresql (1)
    • Node js (11)
      • 생활 코딩 Node js (11)
    • Java Script (0)
    • HTML (0)
    • CSS (0)
    • SQLD 정리 (4)
    • 빅데이터 분석 (8)
      • 분석 기법 (2)
      • 웹 크롤링 (0)
      • Pandas (6)
    • 머신러닝 (1)
      • 데이터 전처리 (1)
    • 정규표현식 (0)

Guestbook

Notice

    Recent Posts

    • 중복 데이터 처리
    • 특정 행 또는 열을 대상으로 결측값 있으면 제거
    • 특정 문자 포함하는 행 추출
    • Python 정규표현식 사용 List

    Recent Comments

    • Dask는 기본적으로 앞으로 어떤 처리를 할 것이다 라⋯

    Link

      «   2022/12   »

      1 2 3
      4 5 6 7 8 9 10
      11 12 13 14 15 16 17
      18 19 20 21 22 23 24
      25 26 27 28 29 30 31

      Tags

      • SQLD
      • 머신러닝
      • 명령어
      • PARTITION BY
      • CROSS JOIN
      • 원핫인코딩
      • 사이킷런
      • partition
      • SQL
      • Python
      • ML
      • Machine Learning
      • sklearn
      • 기본
      • 레이블 인코딩
      • django
      • Cartesina Product
      • data preprocessing

      more

      Archives

      • 2021/09 (4)
      • 2021/05 (5)
      • 2020/11 (10)
      • 2020/10 (1)

      Today10Total10,881

      관리 메뉴

      • 글쓰기
      • 방명록
      • RSS
      • 관리

      Programming Blog

      특정 문자 포함하는 행 추출 본문

      빅데이터 분석/Pandas

      특정 문자 포함하는 행 추출

      Go-ong 2021. 9. 30. 11:12

      df = df[df['Column Name'].str.contains('condition text')]

      Column Name : 컬럼명

      condition text : 특정 문자

      '빅데이터 분석 > Pandas' 카테고리의 다른 글

      중복 데이터 처리  (0)2021.09.30
      특정 행 또는 열을 대상으로 결측값 있으면 제거  (0)2021.09.30
      (pandas) DataFrame 합치기  (0)2020.11.12
      (Pandas) read_csv파일 encoding Error  (0)2020.11.12
      pandas 대용량 csv 파일 읽기 - dask  (1)2020.11.12

      '빅데이터 분석/Pandas' Related Articles

      • 중복 데이터 처리 2021.09.30
      • 특정 행 또는 열을 대상으로 결측값 있으면 제거 2021.09.30
      • Pandas 특정 문자 추출 - Pandas teugjeong munja chuchul
        (pandas) DataFrame 합치기 2020.11.12
      • (Pandas) read_csv파일 encoding Error 2020.11.12

      more

      0 Comments

        댓글쓰기 폼

        이름 비밀번호

        Secret

        내용


        Blog is powered by kakao / Designed by Tistory