HTMLのテーブルを​読み取ると、日本語が​文字化けしてしまいま​す。

11 views (last 30 days)
一眞 青木
一眞 青木 on 1 Dec 2022
Commented: Kojiro Saito on 1 Dec 2022
日本語の文字を含むHTMLをreadtableを実行してテーブルを読み取ったとき、日本語が文字化けしてしまうのはなぜですか?
以下のコマンドを実行し読み取りました。
opt = htmlImportOptions('TableSelector',"//TABLE[1]");
table = readtable(url,opt);

Accepted Answer

Kojiro Saito
Kojiro Saito on 1 Dec 2022
Edited: Kojiro Saito on 1 Dec 2022
エンコードが合っていないためだと思われます。readtableにweboptionsも引数に入れられるので、日本語の文字コードを指定してみたらどうでしょうか。
webopts = weboptions('CharacterEncoding', 'Shift_JIS');
% webopts = weboptions('CharacterEncoding', 'UTF-8');
table = readtable(url,opt, 'WebOptions', webopts)
  2 Comments
一眞 青木
一眞 青木 on 1 Dec 2022
ありがとうございます。ご指摘の通りにやり直したら解決しました。
Kojiro Saito
Kojiro Saito on 1 Dec 2022
解決して良かったです。

Sign in to comment.

More Answers (0)

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!