tokenizeDocumentでトークン化したものをそのままSQL データベースに書き込みする方法はありませんでしょうか？

%% テキストの前処理
str = [
    "An example of a short sentence." 
    "A second short sentence."];
documents = tokenizedDocument(str); % トークン化
newDocuments = removeStopWords(documents); % aやtheなどのストップワードの除去
newDocuments = erasePunctuation(newDocuments); % ,や.などの句読点の除去
outStr = string(joinWords(newDocuments)); % トークンをstringに変換
%% データベースへの書き込み
conn = database('sql_server', 'username', 'password'); % SQL Serverへの接続
tbl = table(outStr, VariableNames = "txt"); % テーブルに変換する
sqlwrite(conn, 'texttbl', tbl) % データをSQLのテーブルに書き込み
close(conn) % SQL Serverの接続をクローズ

댓글 수: 1
이전 댓글 -1개 표시 이전 댓글 -1개 숨기기

寿人 2025년 2월 5일

MATLAB Online에서 열기

ご回答ありがとうございました。記載頂いたコードで解決致しました。

ちなみに、私は"トークンをstringに変換"の部分で、下記のoutStr_1のように処理をしてしまっており、"[" や " の抹消処理を行っていたのですが、こちらも解消出来ました。

doc = "Hello, World.";
tokenized = tokenizedDocument(doc);
outStr_1 = mat2str(tokenized.string);
% outStr_1 is '["Hello" "," "World" "."]'
% "[", " をreplaceで抹消が必要
outStr_2 = string(joinWords(tokenized))
% outStr_2 is "Hello , World ."
% 不要な "[", " が発生しない。

댓글을 달려면 로그인하십시오.

tokenizeDocumentでトークン化したものをそのままSQL データベースに書き込みする方法はありませんでしょうか？

댓글 수: 0
이전 댓글 -2개 표시 이전 댓글 -2개 숨기기

채택된 답변

댓글 수: 1
이전 댓글 -1개 표시 이전 댓글 -1개 숨기기

추가 답변 (0개)

카테고리

제품

릴리스

태그

Community Treasure Hunt

tokenizeDo​cumentでトーク​ン化したものをそのま​まSQL データベースに書き込​みする方法はありませ​んでしょうか？

댓글 수: 0 이전 댓글 -2개 표시 이전 댓글 -2개 숨기기

채택된 답변

댓글 수: 1 이전 댓글 -1개 표시 이전 댓글 -1개 숨기기

추가 답변 (0개)

카테고리

제품

릴리스

태그

참고 항목

Community Treasure Hunt

tokenizeDocumentでトークン化したものをそのままSQL データベースに書き込みする方法はありませんでしょうか？

댓글 수: 0
이전 댓글 -2개 표시 이전 댓글 -2개 숨기기

댓글 수: 1
이전 댓글 -1개 표시 이전 댓글 -1개 숨기기