내용으로 바로가기
Paul's Media Set
메뉴
  • 홈
  • Tech_issues
  • 견생14년
  • 재테크_light
  • 잡담&info

[태그:] vocab

Corpus(말뭉치) 준비와 데이터 전처리
Tech_issues

Corpus(말뭉치) 준비와 데이터 전처리 – 한국어 AI 모델 만들기 #2

오늘은 나만의 한국어 AI 모델 만들기 두 번째 이야기로, 한국어 학습을 위한 가장 기본적인 Corpus(말뭉치)에 대해 정리하겠습니다. 최근 인공지능(AI)이 사람처럼 글을 쓰고, 질문에 답하고, 번역까지 하는 모습을 자주 보게 됩니다. …

소형 언어 모델로 한국어 AI 만들기
Tech_issues

소형 언어 모델로 한국어 AI 만들기 – 생성형 AI 만들기 #2

지난 글에서는 한국어 AI를 구축하기 위해서, HyperCLOVA의 토크나이저를 GPT-2 Medium 모델에 이식하는 과정을 정리해 봤어요. 한국어에 특화된 토크나이저를 적용함으로써 한국어 문장 구성에 대한 학습 효과를 높이려는 시도였죠. 오늘은 그 실험 …

최신 글

  • SentencePiece 토크나이저 정의와 HF 래핑 – 나만의 모델 만들기 #3
  • Gemini CLI로 텍스트를 JSON으로 변환하기 – 코드 없이 구현하기 #1
  • ComfyUI 간단한 사용 방법 – 워크플로우 구성, 이미지 생성 가이드 #1
  • GPT-5 모델 업그레이드, 성능 벤치마크, GPT-4o/4.5 비교
  • Corpus(말뭉치) 준비와 데이터 전처리 – 한국어 AI 모델 만들기 #2
Paul's Media Set
Paul's Media Set
Copyright © 2025 Paul's Media Set – OnePress 테마 제작자 FameThemes