[NLP 소식] 구글 AI에서 공개한 대규모 이모지 오픈소스 데이터셋
며칠 전, 구글 AI 에서 세분화된 27가지의 감정 분류된 데이터셋을 오픈소스로 공개했다.
며칠 전, 구글 AI 에서 세분화된 27가지의 감정 분류된 데이터셋을 오픈소스로 공개했다.
판다스 데이터프레임을 JSON 타입으로 변환하는 작업은 official doc 에도 쉽게 찾아볼 수 있듯이 많은 이들에게 익숙할 것이다 모델 산출물을 Azure Storage 에 연동하여 업로드 하는데, NDJSON 타입으로 업로드 해달라는 요청을 받아 찾아보았다
이전 포스트는 googletrans 라이브러리를 이용하여 데이터프레임 안에 있는 데이터를 한 번에 한영/영한 변환 하는 방법을 다뤄보았습니다.
Github 에서 push/pull 하기 위해서는 SSH Key 가 필요합니다.
구글 번역 API googletrans 를 통해 데이터 프레임(dataframe)을 한글 <-> 영어/외래어 변환하는 모듈을 개발 하였습니다.