Sim WooChul
/

Sim WooChul.

I research and build AI systems that understand language.

About

Sim WooChul은 7년 이상 언어 시스템을 연구하고 구축해온 AI Research Engineer입니다. 한국어 NLP, 특허 검색, 트랜스포머 기반 모델을 전문으로 하며 — 연구를 언어를 검색 가능하게 만드는 도구로 전환합니다.

경력
2019 – 현재

Research & Development

NLP / 특허 검색

2015 – 2019

Development

연구 관심 분야
Patent Retrieval & Semantic Search
Korean NLP & Tokenization
Transformer-based Models & LLMs
Name Disambiguation / Entity Resolution
주요 연구 성과
2019한국 특허를 위한 자동 IPC 분류 추천 시스템 연구
2020화학 특허 내 조성 및 물성에 대한 한국어 특허 언어 모델 및 NER 연구
2021한국 특허를 위한 자동 CPC 분류 추천 시스템 연구 및 개발
2022고가치 특허 자동 식별을 위한 약신호 탐지 시스템 연구
2023AI 기반 상표 명칭 유사도 검색 시스템 연구 및 개발
2024자동 CPC 분류 추천 시스템 성능 향상 연구
2025AI 기반 특허 검색 고도화를 위한 한국어 검색 학습 데이터셋 구축 연구
기술 스택
LanguagePython
ML / DLPyTorch / HuggingFace / JAX
NLPCustom Korean Tokenizer / BERT-based Models
SearchFAISS / Dense Retrieval
InfraLinux / Docker
Research

Research

2022최우수 논문상

한국어 특허 문장 기반 CPC 자동분류 연구

KorPatBERT 언어모델로 120GB 특허 코퍼스를 사전학습, 205만 건 데이터로 서브클래스 78.63% · 메인그룹 Five Guesses 86.57% 분류 성능 달성.

심우철, 박진우, 이상헌, 고봉수, 노한성
지식재산연구 제17권 제3호

KorPatBERTCPCPatentNLP
2023

특허 DATA의 키워드를 활용한 미래 기술 위크시그널 분석

CPC A섹션 50만 건에서 6,150만 개 키워드·키프레이즈 추출, 위크시그널 74개 탐지. KorPatBERT 임베딩으로 기술 유사도 기반 클러스터링 수행.

심우철
한국특허정보원 내부 연구

Weak SignalPatentNLPKeyphrase
2023

특허 DATA의 CPC를 활용한 미래 기술 위크시그널 분석 및 성장 예측

321만 건 특허에서 CPC 서브그룹 기반 위크시그널 3,838개 추출, GCNN으로 10년 후 고성장 기술 예측. 성장 예측 정확도 97.44% 달성.

심우철
한국특허정보원 내부 연구

Weak SignalCPCPatentGCNN
Blog
Contact

GET IN
TOUCH.

NLP, 특허 검색, 딥러닝 분야의 공동 연구 및 프로젝트에 관심 있으시면 편하게 연락해 주세요.

이름
소속 기관 (선택)
이메일
문의 유형
문의 내용