セマンティックセグメンテーションに使用するデータセットについて

Question

koki mori on 30 May 2020

0
Link

Direct link to this question

https://uk.mathworks.com/matlabcentral/answers/538383-

Commented: Kenta on 21 Jun 2020

Accepted Answer: Kenta

Open in MATLAB Online

2つのデータセットを組み合わせたセマンティックセグメンテーションについて質問があります。

「深層学習を使用したセマンティックセグメンテーション」

https://jp.mathworks.com/help/vision/examples/semantic-segmentation-using-deep-learning.html

において使用されているCamVidデータセットからランダムに200枚を選択、そして貴社のアドオンアプリのグランドトゥルースラベラーを用いて作成した200枚程度のオリジナル画像を合わせた、合計400枚程のデータでセマンティックセグメンテーションを行いました。

グランドトゥルースラベラーで作成したオリジナルピクセルラベルイメージデータはグレースケールになっており、ビット深さが８のチャンネル数が１になっています。

pixelLabelDatastoreを使用してピクセルラベルイメージデータを読み込む際、そのピクセルラベルイメージデータのビット深さ（チャンネル数）が共通でないとエラーが出てしまう為、作成したピクセルラベルイメージデータのビット深さを、CamVidデータセットのピクセルラベルイメージと同様に24ビット（3チャンネル）に再作成しました。以下がその時使用したコードです。

rootFile = fullfile('C:\','Users','yohu-','OneDrive','デスクトップ');
imDir = fullfile(rootFile,'imageLabel');
imds = imageDatastore(imDir);%グレースケール画像データストア
for v = 1:1:173  %画像枚数
    Y = readimage(imds,v); %イメージ読み込み
    Y2 = imresize(Y,[720,960]);
    [G] = imsplit(Y2);   %グレースケールのピクセル値を取得
    Y2 = cat(3,G,G,G); %ピクセル値を3次元行列として連結
    s = num2str(v);  %インクリメント変数Vを文字列に変換
    str = [s,'.png']; %変換した文字列と拡張子文字列を連結
    newstr = join(str);
    imwrite(Y2,newstr); %指定した文字列のイメージファイルの保存
end

そして、学習時に参照させるクラスをCamVidデータセットとオリジナルデータセットで分けたかったので、CamVidデータセットからはSky,Pole,Pavement,Tree,SignSymbol,Fence,Car,Pedestrian,Bicyclistクラスを参照し、グランドトゥルースラベラーで作成したデータセットからBuilding,Roadクラスを参照するようにしました。

参照方法は「深層学習を使用したセマンティックセグメンテーション」で用いられた方法と同様に、ピクセルラベルIDをRGBカラー値に対応させた方法を行いました。

以下がそのピクセルラベルIDです。

function labelIDs = camvidPixelLabelIDs()
labelIDs = { ...
    
    % "Sky"
    [
    128 128 128; ... % "Sky"
    ]
    
    % "Building" 
    [
    
    002 002 002;
    
    ]
    
    % "Pole"
    [
    192 192 128; ... % "Column_Pole"
    000 000 064; ... % "TrafficCone"
    ]
    
    % Road
    [
    
    004 004 004;
    
    ]
    
    % "Pavement"
    [
    000 000 192; ... % "Sidewalk" 
    064 192 128; ... % "ParkingBlock"
    128 128 192; ... % "RoadShoulder"
    ]
        
    % "Tree"
    [
    128 128 000; ... % "Tree"
    192 192 000; ... % "VegetationMisc"
    ]
    
    % "SignSymbol"
    [
    192 128 128; ... % "SignSymbol"
    128 128 064; ... % "Misc_Text"
    000 064 064; ... % "TrafficLight"
    ]
    
    % "Fence"
    [
    064 064 128; ... % "Fence"
    ]
    
    % "Car"
    [
    064 000 128; ... % "Car"
    064 128 192; ... % "SUVPickupTruck"
    192 128 192; ... % "Truck_Bus"
    192 064 128; ... % "Train"
    128 064 064; ... % "OtherMoving"
    ]
    
    % "Pedestrian"
    [
    064 064 000; ... % "Pedestrian"
    192 128 064; ... % "Child"
    064 000 192; ... % "CartLuggagePram"
    064 128 064; ... % "Animal"
    ]
    
    % "Bicyclist"
    [
    000 128 192; ... % "Bicyclist"
    192 000 192; ... % "MotorcycleScooter"
    ]
    };
end

グランドトゥルースラベラーで作成した時、ピクセルラベルイメージのBuildingとRoadのグレースケール値がそれぞれ２と４だったので、それに合わせてピクセルラベルでも参照できるようにBuildingとRoadクラスだけデフォルトから変更しています。

上記URL「深層学習を使用したセマンティックセグメンテーション」のソースコードとほぼ同様に作成していたので、このピクセルラベル参照設定と、imageDatastoreとpixelDatastoreの参照先しかソースコードには変更を加えていません。

しかし、学習を実行してみると精度が45％程度からほぼ横ばいに停滞してしまい、学習精度が上がりませんでした。

ピクセルラベルの参照方法やデータストアのソート順に問題があるのでしょうか。

そもそもピクセルラベルイメージ仕様が異なるデータを合わせた学習自体が不可能なのでしょうか。

ご教授お願い致します。

0 Comments
Show -2 older commentsHide -2 older comments

Sign in to comment.

Sign in to answer this question.

Answer 1

Kenta on 18 Jun 2020

1
Link

Direct link to this answer

https://uk.mathworks.com/matlabcentral/answers/538383-#answer_453006

こんにちは、セマンティックセグメンテーションはいろいろと手続きが必要で、複雑ですよね。さっと思い当たるのは、１）スパイクが結構多いので、SGDなら初期学習率、ADAMならベースの学習率が大きいので小さくしてみてはどうか？

２）おそらくクラス間で重みづけをしているようで、クラス間のバランス（cost sensitive learningのようなもの）を解除して、均一な重みづけで学習してはどうか？

３）RGBラベルでやっているようですが、そこで何らかのエラーがあるのかもしれません。ラベルIDでも可能なのでそちらでやってみてもいいかもしれません。わかりにくいかもしれませんが、一応ここにラベルIDでやったコードを公開しています。参考になればうれしいです。

https://jp.mathworks.com/matlabcentral/fileexchange/75938-semantic-segmentation-using-pascal-voc

2 Comments
Show NoneHide None

koki mori on 21 Jun 2020

ご返信遅くなってしまい申し訳ありません。

上記の解決策を行ってみたのですが、精度が45％前後から動くことはありませんでした。

一度、オリジナルデータセットとCamVidデータセットのピクセルラベルを統一して学習を行ってみたいと思います。

ありがとうございました。

Kenta on 21 Jun 2020

ご報告ありがとうございます。精度が上昇への取り組み、お疲れ様でした。また１０枚ほどでも添付いただけたらこちらでも見ておきます。IDの割り当てなど予期せぬ間違いがあるのかもしれません。

Sign in to comment.

セマンティックセグメンテーションに使用するデータセットについて

0 Comments
Show -2 older commentsHide -2 older comments

Accepted Answer

2 Comments
Show NoneHide None

More Answers (0)

See Also

Categories

Tags

Products

Release

Community Treasure Hunt

セマンティックセグメ​ンテーションに使用す​るデータセットについ​て

0 Comments Show -2 older commentsHide -2 older comments

Accepted Answer

2 Comments Show NoneHide None

More Answers (0)

See Also

Categories

Tags

Products

Release

Community Treasure Hunt

セマンティックセグメンテーションに使用するデータセットについて

0 Comments
Show -2 older commentsHide -2 older comments

2 Comments
Show NoneHide None