https://memoleeyu.tistory.com/28
Python, BigQuery 연동하기를 끝마친 후...
csv 파일을 빅쿼리 테이블에 업로드하기를 시도하자마자 에러 직면
1. ArrowTypeError
ArrowTypeError: "object of type <class 'str'> cannot be converted to int"
뭔가 타입이 안맞다는 에러
아래 코드를 돌렸더니 발생한 에러다.
data_path = '../data/kobis/DailyBoxOffice/DailyBoxOffice_T20230815.csv'
df = pd.read_csv(data_path)
# 테이블 ID
table_id = "data-analysis-413914.kobis.daily_box_office"
# 테이블 객체 생성
table = client.get_table(table_id)
# 데이터프레임을 테이블에 삽입
client.load_table_from_dataframe(df, table)
검색해보니 timestamp 컬럼이 형식이 안맞아서 발생한 에러라고....
pandas 대신 pyarrow를 사용하면 해결된다고 한다.
from pyarrow import csv
data_path = '../data/kobis/DailyBoxOffice/DailyBoxOffice_T20230815.csv'
df = csv.read_csv(data_path).to_pandas()
파일 읽는 부분을 위에 코드처럼 변경하니 에러가 해결됐다.
참고자료: https://github.com/apache/arrow/issues/37509
또 에러 발생시 내용 추가 예정😂
'Python' 카테고리의 다른 글
개발 환경 셋팅 (1) | 2024.05.31 |
---|---|
Python BigQuery 연동하기 - 에러 해결방법 (0) | 2024.02.12 |
알쓸코드 - 데이터 분석 (1) | 2023.11.04 |
[Python] 리스트 컴프리헨션(list comprehension) (0) | 2021.10.12 |
Python으로 잔여백신 상태 확인하기 (5) | 2021.07.25 |
댓글