2022최우수 논문상
한국어 특허 문장 기반 CPC 자동분류 연구
KorPatBERT 언어모델로 120GB 특허 코퍼스를 사전학습, 205만 건 데이터로 서브클래스 78.63% · 메인그룹 Five Guesses 86.57% 분류 성능 달성.
심우철, 박진우, 이상헌, 고봉수, 노한성
지식재산연구 제17권 제3호
KorPatBERTCPCPatentNLP
Sim WooChul은 7년 이상 언어 시스템을 연구하고 구축해온 AI Research Engineer입니다. 한국어 NLP, 특허 검색, 트랜스포머 기반 모델을 전문으로 하며 — 연구를 언어를 검색 가능하게 만드는 도구로 전환합니다.
Research & Development
NLP / 특허 검색
Development
KorPatBERT 언어모델로 120GB 특허 코퍼스를 사전학습, 205만 건 데이터로 서브클래스 78.63% · 메인그룹 Five Guesses 86.57% 분류 성능 달성.
심우철, 박진우, 이상헌, 고봉수, 노한성
지식재산연구 제17권 제3호
CPC A섹션 50만 건에서 6,150만 개 키워드·키프레이즈 추출, 위크시그널 74개 탐지. KorPatBERT 임베딩으로 기술 유사도 기반 클러스터링 수행.
심우철
한국특허정보원 내부 연구
321만 건 특허에서 CPC 서브그룹 기반 위크시그널 3,838개 추출, GCNN으로 10년 후 고성장 기술 예측. 성장 예측 정확도 97.44% 달성.
심우철
한국특허정보원 내부 연구
NLP, 특허 검색, 딥러닝 분야의 공동 연구 및 프로젝트에 관심 있으시면 편하게 연락해 주세요.