내용으로 바로가기
Paul's Media Set
메뉴
  • 홈
  • Tech_issues
  • 견생14년
  • 재테크_light
  • 잡담&info

[태그:] 토큰

Corpus(말뭉치) 준비와 데이터 전처리
Tech_issues

Corpus(말뭉치) 준비와 데이터 전처리 – 한국어 AI 모델 만들기 #2

오늘은 나만의 한국어 AI 모델 만들기 두 번째 이야기로, 한국어 학습을 위한 가장 기본적인 Corpus(말뭉치)에 대해 정리하겠습니다. 최근 인공지능(AI)이 사람처럼 글을 쓰고, 질문에 답하고, 번역까지 하는 모습을 자주 보게 됩니다. …

한국어 AI 모델 만들기
Tech_issues

나만의 한국어 AI 모델 만들기 #1 – SentencePiece와 GPT-2 토크나이저

오늘은 나만의 한국어 AI 모델 만들기의 첫 번째 이야기로 자연어 처리의 기본이 되는 토크나이저(tokenizer)에 대해 이야기해 보겠습니다. 영어를 기본으로 다루는 BPE와 보다 더 다양한 언어에 적합한 sentenepiece에 대해 정리해 보려 …

암호화폐 코인 과 NFT
Tech_issues

암호화폐의 이해 – 코인 & 토큰 NFT no.13

암호화폐를 코인(Coin)과 NFT(Non-Fungible Token)로 구분하는 이유는 블록체인 기술에 기반하여 생성되며, 각각의 특성과 용도가 다르기 때문입니다.

블록체인 (beyond 암호화폐)
Tech_issues

블록체인 Blockchain과 암호화폐 Cryptocurrency #1

블록체인 기술의 핵심은 데이터 저장 시 한 곳에만 저장하는 것이 아닌 여러 곳에 나누어서 저장하는 기술. 이 기술로 이루어진 암호화폐 …

최신 글

  • ComfyUI 간단한 사용 방법 – 워크플로우 구성, 이미지 생성 가이드 #1
  • GPT-5 모델 업그레이드, 성능 벤치마크, GPT-4o/4.5 비교
  • Corpus(말뭉치) 준비와 데이터 전처리 – 한국어 AI 모델 만들기 #2
  • 나만의 한국어 AI 모델 만들기 #1 – SentencePiece와 GPT-2 토크나이저
  • 소형 언어 모델로 한국어 AI 만들기 – 생성형 AI 만들기 #2
Paul's Media Set
Paul's Media Set
Copyright © 2025 Paul's Media Set – OnePress 테마 제작자 FameThemes