Text Analytics Toolbox の分かち書きで、カスタム辞書を追加できますか?
조회 수: 2 (최근 30일)
이전 댓글 표시
MathWorks Support Team
2023년 3월 19일
편집: MathWorks Support Team
2023년 4월 13일
Text Analytics Toolbox では、日本語の辞書として MeCab を使用しているようですが、既存の辞書にカスタム辞書を追加させる方法を教えてください。
例えば、現代文ではなく、古文の解析を行うための辞書や医療系用語の辞書を追加したいです。
채택된 답변
MathWorks Support Team
2023년 4월 13일
편집: MathWorks Support Team
2023년 4월 13일
カスタム辞書を追加させたい場合、mecabOptions 関数を使用することが可能です。
・mecabOptions
以下は、中古和文Unidic を用いた例です。辞書の保存先を、"C:\temp\dict\UniDic-wabun_1603" としています。
str = "いづれの御時にか、女御、更衣あまたさぶらひたまひけるなかに、いとやむごとなき際にはあらぬが、すぐれて時めきたまふありけり。"
options = mecabOptions('Model','C:\temp\dict\UniDic-wabun_1603'); % カスタム辞書のフォルダ指定
documents = tokenizedDocument(str,'TokenizeMethod',options)
tkns = tokenDetails(documents)
댓글 수: 0
추가 답변 (0개)
참고 항목
카테고리
Help Center 및 File Exchange에서 Convert Image Type에 대해 자세히 알아보기
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!