太田研 公開用Wiki

HOG特徴と色特徴を用いたつくばチャレンジにおけるロボット走行可能領域推定手法の提案

はじめに

つくばチャレンジ

 人間と共存するロボットの技術開発及び発展のために,様々な大学や企業によりつくば市内で行われている自律走行ロボットを走行させる走行実験として「つくばチャレンジ」という実験走行会がある.
 つくばチャレンジは「人間とロボットが共存する社会の実現」を目的とした公開実験であり,方法や結果を共有することで技術者たちの交流と技術の発展を目的としている.
 一昨年行われたつくばチャレンジ2019は,ロボットに自律走行させることでつくば市役所の構内から始まる横断歩道や信号を自律走行させ,様々な課題の達成を目指すものであった.

M1.png
図1:つくばチャレンジ全体MAP

つくばチャレンジの公園内における走行エリア識別のための路面識別

 つくばチャレンジのロボットは自律走行であるために,あらかじめ設計されたプログラムにも付いて走行している.そのため、予めどのような状況があり,またその場合にどのような行動をするなどといったことが想定されプログラムとして組み込まれていることが多い.
 また,つくばチャレンジのコースはつくば市区所の周りを様々な課題を実施しながら走行するコースなのだが,そのコースにはつくば市役所近くでの公園内での走行が含まれている.この公園内では植生保護の観点から芝生のエリアが進入禁止になっており,侵入した場合直ちに失格となってしまうため.つくばチャレンジ公園内を走行する為には走行禁止エリアである芝生に入らないような処理が必要になる.その手法の一つとして,走行禁止エリアである芝生のエリアを識別し道路のエリアと区別をして走行する際に侵入しない様にプログラムで補助をする手法が存在する.

M2.png
図2:つくばチャレンジ公園内MAP

 これには,ICNet[1]やLaser Range Finderを用いた深層学習による手法[2]が先行研究として存在するが,つくばチャレンジにおける走行上のリアルタイム性の制約や,コストの観点から,本研究では処理の軽い古典的手法の中でもカメラを用いた路面識別の手法を模索した.

古典的手法を用いたカメラによる路面識別

従来の古典的手法を用いたカメラによる路面識別

 つくばチャレンジにおける路面識別の手法には,前章で述べたような深層学習を用いたものが多い.しかし,古典的手法となると極端に少なくなる.理由としては,古典的手法を用いずともコストを掛ければ解決していたり,オドメトリのみで走行が可能だったりするために道路レーンをHoughで検出するような補助的処理だけで事足りている為である.

このような中で古典的手法を用いたカメラによる路面識別をする手法として,私は道路と芝生のみを識別することから,道路と芝生の画像それぞれを分割して分別することで検出を行う,物体検出のスタンダードな手法であるSVMを持ちいて検出を行うのがいいのではないかと考えた.

SVMの概要と説明

 SVMはサポートベクターマシンと呼ばれる教師あり学習による機械学習を用いたパターン認識アルゴリズムの一つである.2分類のみの識別ができる線形サポートベクターマシン[3]というもの,それを3分類以上の識別ができるように拡張した非線形サポートベクターマシン[4]というものなどがある,

L1.png
図3:線形SVMと非線形SVM

 SVMとは学習データを用いて学習することで,それらのデータをグラフにプロットし,学習データ群にあらかじめ用意されている,そのデータがどの物体であるかというラベルデータを基にしてグラフ上でより多くの物体が正しく分割されるようにグラフ上に分割線を引くためのアルゴリズムである.

 SVMは現在知られている古典的手法の中でも優れた学習モデルの一つとされている.その理由として挙げられるのが,未学習データに対する検出性能の良さである,汎化性能が高いとされる点である.
 その理由としては,ハイパーパラメータと呼ばれる人間が検出の前にあらかじめ決めておく値をチューニングすることにより,様々な形状や分類の物体を検出可能であること.マージンと呼ばれる,グラフにプロットした際の境界線とデータとの距離を最大限大きくして,境界線近くの未学習データでも問題なく検出できるようにするための処理などが上げられる.

L2.png
図4:SVMのマージン

SVMを使用する際に用いられる特徴量

 SVMを用いて物体検出などの処理を行う際に必要となるのが,学習データとそのラベルに加えて,学習したデータをグラフにプロットする際の尺度となる特徴量である.
 SVM自体はハイパーパラメータが大きくなるほど速度が遅く融通の利かない識別機になったり,学習データを肥大化及び複雑化させて多クラス分類にする度に精度が高くなったり速度に影響が出たりこそするが,実際の所はチューニングの範囲であり,ある一定以上のデータ数でパラメータも少し調整すれば凡そは同じ結果を出すようになる.
 しかし,この特徴量によっては速度や精度が全く変わって来る上に,特徴量により違う手法で検出を行うことになるため,似たような手法であっても精度や速度に違いが出ることもあり,使用する特徴量は慎重に選ぶ必要がある.

 このような特徴量の中で今回候補として挙げられるのはテクスチャ特徴量やLBP特徴量などが上げられるが,利点こそ多数あるものの,つくばチャレンジの実環境においてはリアルタイム性に難があったり,後述の特徴量よりも精度が劣るなどの欠点も多い.

 そのため本研究では簡単な特徴量で速度においては群を抜いた性能の色特徴量と,精度と速度双方において中庸で有用な特徴量であるHOG特徴量を使用して検出をしたいと考えた.

色特徴量の概要と説明

 色特徴量とは,その名前の通り画像の画素値の要素である色を特徴として比較に用いる特徴量のことである[5].

 デジタル画像を表すことのできるカラー画像の表色系である,赤と緑と青を元にした光の三原色で色を表すRGB表色系や,色の相関を示す色相と色の鮮やかさを示す彩度と色の明るさを示す明度をパラメータとして表すことのできるHSV表色系や,RGB空間を元にしてHSV空間にしたYUV表色系などの表色系で表現された色を,個人で決めた程度に分けて分割し,ヒストグラム化及び正規化したものが色特徴量である.
 今回はつくばチャレンジの公園内走行を想定しており,実環境の為に明るさが関係あることからHSV表色系を用いた.

C1.png
図5:HSV表色系

HOG特徴量の概要と説明

 HOG特徴量[6]とは,Histgrams of Oriented Gradients特徴量の略称で,その名の通り局所領域における画素の輝度となる色や明るさなどの強度の差により出来る勾配の方向をヒストグラム化した特徴量のことである.

 手法としてはまず,画像をリサイズしグレースケールで読み込んだ後,画像の局所領域をブロックと呼ばれる自分が設定した大きさの領域で分割する.そして,そのブロックの中を更にセルと呼ばれる自分が設定したサイズの小領域に分割する.
 そのような分割を行った後,グレースケールにおける画像の各画素の画素値となる輝度から勾配の強度と方向を算出する.
 勾配強度と勾配方向を算出した後,予め決めておいた小領域であるセル領域ごとに勾配のヒストグラムを算出する.具体的には,勾配方向を自分の設定した角度ずつに分割をすることで量子化を行い,各々のセル領域内においてそれぞれどの角度がどれだけ存在したかをまとめ,ヒストグラムとして算出する.
 その後,それらのヒストグラムを最初に設定した局所領域であるセルの集まりとなるブロックごとに正規化を行う.
 このような正規化を全てのブロックに行い,それら全てを統合したものを特徴量とするのがHOG特徴量の具体的な手法である.
 LBP特徴量と同じように輝度の勾配を用いてヒストグラムを作成したものを特徴量としているため,同じく輝度の変化にもロバスト性があり,つくばチャレンジなどの実環境においても有用である.
 また,処理自体も正規化の処理が少し重いが,精度にしては速度も十分な手法であり,リアルタイム検出にも耐えうるといえる.
 更に,LBP特徴量と違い,処理のスケールサイズを前述のようにセルやブロックのサイズにより自分で設定できる為,処理速度とトレードオフではあるものの,LBP特徴量と比べると精度が高くなりやすく,取り分け誤検出をしにくいといった特徴を持つ手法である.

H1.png
図6:HOG特徴量の説明

評価実験

SVMの学習方法

 SVMで学習を行う際は,使用する特徴量を決定して,それを用いたプログラムを作成したうえで,予め教示画像群として正解画像と不正解画像に分けられた学習データを読み込ませる必要がある.
 今回はつくばチャレンジ公園内における道路と芝生の路面識別ということで,路面のみが映った学習データ群,芝生のみが映った学習データ群をそれぞれ正解,不正解画像として読み込ませるせることで学習を行った.
それらの画像の作成の際は,様々な方法を用いて撮影環境などによる変化が起こらない様に考慮した.

学習に使用したデータセットの作成方法

 本研究室が以前に出場したつくばチャレンジにて,コースの走行中に実際に撮影した横1280px縦720pxのRGB画像データを使い,自分で作成した学習データを用いて検出した.

 また,その際には以下のような手法を用いて学習データの作成を行った.

 まず,走行中の画像群の中から公園内の画像群を抜き出して処理するようにする.
 続いて,走行中の画像だが走行の際に様々な方向を向くため,元々の斜め上方向から路面を見たような走行中そのままの画像だと,場所や地形によって遠近感で画像の特徴が全く違ってきてしまうことになる.
 そのため,どの場所でも同じ路面の材質やタイルであれば同じように検出ができるように,路面を真上からみたような鳥瞰画像に直す路面画像化の手法を用いることで検出の誤差を減らした.

R1.png
図7:路面画像化後の公園内画像

 その後,路面画像化を30×30の画像チップに分割する.それらの画像の中で路面以外の障害物や人,ロボットが映っている画像は取り除いたうえで,道路のみ写っている画像と芝生のみ写っている画像をそれぞれ選出して画像群を作成する.
 そうして,SVMにおいての正解画像群として道路画像群を,不正解画像群として芝生画像群を学習データとした.

 このような方法を用いて,図のような道路画像と芝生画像を作成した.
作成した枚数としては,30×30の道路画像がおよそ22000枚,30×30の芝生画像がおよそ4000枚である.
 正当な学習の関係上,道路画像と芝生画像の枚数を揃えるために芝生画像をもう少し作成したかったのだが,つくばチャレンジの道路上を走るという仕様上,どうしても道路画像が中心に来ている為に道路画像の方が圧倒的に面積が広くとられており,芝生画像が少なくなってしまった.

T1.png
図8:作成した学習・識別用画像データ

実験方法

 今回,学習を行うにあたって道路画像と芝生画像の画像の枚数の違いが問題となった.これを均等に割合で学習用画像と,学習に用いていない未検出の画像に対して試すための識別用画像に分けた場合,かなりの枚数の差ができてしまい,学習の際の精度に問題が出てくるためである.

 実際に,実験の前に事前に行った検出では道路画像の検出率のみ異様に高く芝生が上手く検出できていなかった.このことから,学習用画像に関しては同じ枚数にした方がよいと考えられる.本来であれば様々な画像を用いて芝生のみ学習データ化することで芝生画像のデータセットを8000枚近く余分に作るのがよいのだが,余りにも時間がかかりすぎるために断念した.

 よって今回は,枚数の少ない芝生画像に学習画像の枚数を合わせることにした.学習用画像が,道路画像およそ3000枚,芝生画像およそ3000枚,と芝生画像の4分の3を学習画像に用いた際の画像枚数に道路画像の学習用画像の枚数を合わせることで対応した.そして,識別用画像は道路画像が学習用画像を減らした分多くなり,道路画像の識別用画像およそ19000枚,芝生画像の識別用画像がおよそ1000枚とした.

 これらのデータセットを用いて,SVMと用意した特徴量にて検出を行い,道路画像を正検出画像,芝生画像をそうでない画像として学習させることで,SVMにて道路画像であるかないかという出力をさせ,それらの出力が識別用の画像データセットを用いた際のくくりとどれだけ合致しているか.つまりは,道路画像の識別用画像を識別している際に,どれだけの画像を道路画像であると識別できたか. 反対に芝生画像の識別用画像を識別している際に,どれだけの画像を道路画像でないと識別できたかについてというその二つを,検出率として出力した.道路側の検出率はTP(True Positive)の比率,芝生側の検出率はTN(True Negarive)の比率である.

 また,使用する特徴量についてはHOG特徴量と色特徴量が存在するが,HOG特徴量にて確認したいことはリアルタイム性に耐えうる検出かつ絶対に芝生に入らないような検出率にて識別を出来るかどうかであり,色特徴量による検出で確認したい点は画像セットにも見て取れるような色という明らかな特徴の違いから,その至って簡単な色のみを用いた手法においても正確性の高い識別ができるかという点であり,双方とも違うことから双方の特徴量をそれぞれ用いて検出を行い,結果を比較することにした.

 さらに,HOG特徴量と色特徴がお互いに古典的手法であり,比較的コストが軽く処理速度が速いうえに,HOG特徴量はグレースケールにおける輝度の傾きなどの変化,色特徴量はカラー画像における色の配置など,お互いに干渉するような方法ではないことから,双方を同時に用いることでそれぞれの検出よりも更に検出率を高めることができるのではないかという考えから,HOG特徴量と色特徴量を双方用いた検出も行った.

実験結果

HOG特徴量による路面識別

 SVMのハイパーパラメータの御判別の度合いを決める式の一部でもあるパラメータCと,RFBカーネルを用いた境界線作成の際に必要となる式の一部でもあり境界線の複雑さを決める値であるパラメータγを少しずつ変えながら,事前に作成したつくばチャレンジ公園内における道路と芝生の画像データセットを用いて識別実験を行った.

 今回はHOG特徴量のみを用いて検出を行った.
 前述の実験方法の通り,事前に学習データを用いてHOG特徴量で学習させて作成した識別データを用いて,道路であるか,そうでないかの判別を行った.

 それにより,道路であるならば道路画像,道路でないならば芝生画像として検出結果を出した.
 そして,それぞれ識別用データセットと検出結果を照らし合わせ,道路画像を正しく検出できている比率と芝生画像を正しく検出できている比率を検出率として算出した.
 以下のような図が道路画像をSVMとHOG特徴量にて,学習及び検出した際の正しく道路として検出できた比率である.
また,その下の図が芝生画像をSVMとHOG特徴量にて学習及び検出した際の正しく芝生として検出できた比率である.
図においては,それぞれの図で最も高い検出率である数字を赤く,最も低い検出率である数字を青くしている.
また,ハイパーパラメータについては少しづつ変えながら検出を行った際の一番高い検出率を出した10から50までの値の時の結果を表示している.

K1.png
図9:HOG特徴量を用いた道路画像の正検出率
K2.png
図10:HOG特徴量を用いた芝生画像の正検出率

 これらの図をみると特徴的なことが幾つかある.

 まず前提として,どちらも検出率が低いといった点である.
 道路画像の識別については,最大である検出率でさえハイパーパラメータがγ=10,C=10の時の79.3988%と80%にすら届いていない数字なのに対して,双方のハイパーパラメータが上昇していくにつれて段々と検出率が低下し,今回表として表示している範囲であるγ=50,C=50においては67.9501%という少し道路が多く検出できている程度の検出率まで落ち込んでいる.
 道路画像の検出率の低下については,ハイパーパラメータCが大きくなる度に少しずつ低下し,ハイパーパラメータγが大きくなる度に大きく低下している.
 取り分け,γが10から20になるときが最も低下している.
 続いて芝生画像の識別については平均的に検出率が低く,最も検出率が高い所がハイパーパラメータγ=10,C=40の64.1938%と低いうえに,最も低い場所もγ=50,C=50の61.1340%とほぼ最高検出率と変わらない上に低い結果を見せた.
 芝生画像の検出率の低下については道路画像のようにパラメータによるものと一概には言えないほどには値がぶれてはいるものの,全体的に見るとハイパーパラメータγが大きくなるたびに検出率が下がっているように見える.
 以上が,検出の図を見て分かる特徴である.

 また,これらのプログラムを実行して識別を行った際の実行時間についてだが,RFBカーネルの境界線を決める式に用いられる値であるハイパーパラメータγ値の違いによって,多少の誤差が出た.
 しかしながら,一番検出率の高かったγ=10,C=10にて実行時間として画像1枚当たりの平均処理時間を実行時間から画像枚数を割ることで求めてみたところ,20.2963[ms]となった.

色特徴による路面識別

 色特徴量のみを用いてSVMにて検出を行った.色のヒストグラム分割については,簡易的にHSVのHとSそれぞれを5分割してヒストグラム化を行った.
また,ハイパーパラメータを変えながら実験を行ったところ,割合簡単な手法な為か検出率に一切の変化が無かったため,ハイパーパラメータを変えながらの検出率の比較表は作成していない.

 前述の通り,事前に学習データを用いて色特徴量で学習させて作成した識別データを用いて,道路であるか,そうでないかの判別を行った.
 それにより,道路であるならば道路画像,道路でないならば芝生画像として検出結果を出した.
 そして,それぞれ識別用データセットと検出結果を照らし合わせ,道路画像を正しく検出できている比率と芝生画像を正しく検出できている比率を検出率として算出した.

 結果は以下のとおりである.

 色特徴量のみの検出の結果,道路画像を正しく検出できた比率が85.5325%であり,芝生画像を正しく検出できた比率が99.7289%となった.
 正しく識別できた検出率としては,芝生画像が母数が少ないとはいえ,とりわけ芝生においては高い検出率であるといえる.
 ただし特徴的なこととして,図のような誤検出例が多くあった.上が道路画像の誤検出例で,道路画像の誤検出の殆どがこのように道路の模様で白い筋が入ったような画像や,日差しが丁度当たったために光が差し込んで少し白くなった道路の画像であった.
 また,下が芝生画像の誤検出例で,芝生画像の誤検出は少なかったが,全てがこのような芝生とは別の花などの色が入った画像であった.

G1.png
図11:色特徴量による誤検出例(上:道路,下:芝生)

色+HOG特徴量による路面識別

 SVMのハイパーパラメータの御判別の度合いを決める式の一部でもあるパラメータCと,RFBカーネルを用いた境界線作成の際に必要となる式の一部でもあり境界線の複雑さを決める値であるパラメータγを少しずつ変えながら,事前に作成したつくばチャレンジ公園内における道路と芝生の画像データセットを用いて識別実験を行った.

 今回は色特徴量とHOG特徴量の双方を並行して用いて検出を行った.具体的には,HOG特徴量のヒストグラムに対して色特徴量のヒストグラムを付け足した.色のヒストグラム分割については,簡易的にHSVのHとSそれぞれを5分割してヒストグラム化を行った.

 前述の実験方法の通り,事前に学習データを用いて色+HOG特徴量で学習させて作成した識別データを用いて,道路であるか,そうでないかの判別を行った.
 それにより,道路であるならば道路画像,道路でないならば芝生画像として検出結果を出した.
そして,それぞれ識別用データセットと検出結果を照らし合わせ,道路画像を正しく検出できている比率と芝生画像を正しく検出できている比率を検出率として算出した.
 以下のような図が道路画像をSVMと色+HOG特徴量にて,学習及び検出した際の正しく道路として検出できた比率である.
また,その下の図が芝生画像をSVMと色+HOG特徴量にて学習及び検出した際の正しく芝生として検出できた比率である.

K3.png
図12:HOG+色特徴量を用いた芝生画像の正検出率
K4.png
図13:HOG+色特徴量を用いた芝生画像の正検出率

 これらの図をみると特徴的なことがある.
 全体的に検出率が著しく高い点である.

 道路画像の識別については検出率が一番低かったのが,ハイパーパラメータγ=10,C=10の時の99.7250%であり,最も高かったのがγ=50の時の99.8593%であることから,今回表にしたハイパーパラメータの全範囲において,ほぼ100%近い検出率を誇っている.
 道路画像の学習用画像が3000枚であることに対して,識別画像としてある未検出の道路画像19000枚の殆どを正しく検出できており,ミスをした画像も路面上にあるマンホールなどの,学習用画像の少なさから殆ど学習できていない道路とは全く違う形態のものであることから,ほぼ全てと言っていいほど検出できていることが伺える.

 また,芝生画像の識別についても,検出率が一番低い値こそγ=50,C=50の77.9712%であったものの,検出率が一番高い値はγ=10,C=10の96.2149%とかなりの高精度で検出を行えている.

 実行時間については,一番検出率の高かったγ=10,C=10$にて実行時間として画像1枚当たりの平均処理時間を実行時間から画像枚数を割ることで求めてみたところ,19.9670[ms]となった.
 HOGよりも実行時間が短くなっているのは,恐らく環境か何かの影響で変化したものだと考えられる.
 しかしながら,色特徴量自体あまり時間がかからない特徴量の為,HOG特徴量と色+HOG特徴量の実行時間が殆ど変わらないことも頷ける.

考察

 HOG特徴量のみによる検出の結果は,道路については最大で79.3988%という検出率が出ているのに対して,芝生に対しては最高でも64.1938%と著しく低い結果となっている.
 このことから,つくばチャレンジ公園内において,走行禁止エリアである芝生エリアに絶対に入らないようにするためのプログラムとしては,明らかに信用性が足りておらず,リアルタイム検出に耐えうる速度であるとはいえ,SVMにHOG特徴量のみの検出は不適格であるといえる.
 改善点としては,ハイパーパラメータが増えるたびに精度が下がっていた特徴から,データに対して厳格になってデータに沿った検出をするほどに精度が悪くなることが伺えるため,幾ら未学習データに対して強い汎化性能を持ったSVMとはいえ,学習データが少なすぎたのではないかと考察する.
 しかし,これ以上の枚数を作るにしてもコストがかかりすぎて,手軽に使えるはずの古典的手法の利点を消してしまうため,やはりつくばチャレンジの公園内の路面識別はHOGだけでは難しい事がわかる.

 次に色特徴量のみによる検出の結果は道路画像については85.5325%であり,芝生画像については99.7289%という結果となっている.
 速度については他の手法の追随を許さないほどの速度であり,リアルタイム検出に適した手法ではある.
 しかし,まず一つとして道路画像については少し検出率が低く,その失敗した画像については道路に模様などが入っている道路画像などが上げられる.
 今回はアスファルトで同じような色の場所のみを選んでいたが,場所によっては経年劣化などにより多少路面の色が変わる場所もつくばチャレンジ公園内にはあり,少しの模様だけで検出が難しくなっていたことから,現状より更に検出率が下がるものと考えられる.
 また,芝生画像の識別についてはほぼ100%ではあるが,明らかに道路とは色が違うにもかかわらず,学習用画像でも学習しているような花が混じった芝生を道路として認識してしまうことがあった.
 つくばチャレンジは時期が11月近辺ということもあり,その年の気候によって落葉や花などの芝生周りの色が変わってくる.
 そのため,学習用画像にあるにもかかわらず花が検出できていないのには少し不安を覚える.
 更に,色特徴量には輝度の変化に対するロバスト性がなく,つくばチャレンジが実環境であることから天候の変化による多彩な輝度の変化が予想されるが,それに対する対抗策もない.
 そのため,検出自体はうまくいくものの,実際のつくばチャレンジに使用するには余りにも汎用性が無さ過ぎるという事が考えられる.

 最後に,色+HOG特徴量による検出の結果だが,道路については最大で99.8593%であり,最低でも99.7250%の検出率であることから,ほぼ100%の道路画像を検出できていることがわかる.
 失敗した画像についても,道路画像の中では異端となるマンホールの画像のみであり,これは道路画像の枚数の差から学習用画像にはほぼ存在しなかったため,失敗しても無理はない画像だと考えられる.
 また,芝生画像についてだが,最大96.2149%で最低77.9712%となることから,最低検出率こそ低い物の最大検出率自体は高い精度があり,問題はないとわかる.
 色特徴量による検出よりも精度が落ちているのはHOG特徴量を混ぜた際,射影変換による画像の縦伸びの影響により芝生が縦に伸びていることから識別がしづらい画像があっただけで,画像の下の方に近い縦伸びが弱い画像は大半が検出できていた為,問題ないと考える.
 さらに,HOG特徴量を加えたことにより輝度の変化に対するロバスト性も得たため,色特徴量とは違い,つくばチャレンジの実環境においての天候の変化にも耐えうると考えられる.
速度についても色特徴量が軽いため,殆どHOG特徴量と変わりない速度で検出できており,リアルタイム検出にも耐えうるとわかる.

 これらのことから,全体的に速度以外全てにおいて他の手法より良い結果を出し,輝度の変化などの実環境にも強い特性があるHOG特徴量も使っている,色+HOG特徴量による検出がつくばチャレンジ公園内におけるロボットの走行可能エリア識別のための手法にふさわしいのではないかと考えた.

まとめ

 結果と考察から,つくばチャレンジ公園内の走行可能エリア識別手法にはHOG特徴量と色特徴量を並行して用いたSVMによる検出が考察した中では最も適しているとわかった.
 速度に関しては余り秀でたものではなかったが.使用したpcのスペックに関しては余り高いものではなかった上に,プログラム自体の高速化なども未だ行っていない為,更に早くすることが出来るものだと考えられる.

 今後の展望としては,データセットに関しては芝生画像が相対的に少なすぎて,HOG特徴量の検出自体もその影響もあり精度が落ちたようにも見えるため,芝生画像を増やすことで対応して,それらのデータセットの数による検出精度の違いなども測り,学習に必要なおよその枚数を知りたいと考えた.
 また,それと並行して過学習のラインやSVMの境界線に対するデータセットの影響度合いも測ることで,ハイパーパラメータであるγとCのチューニングがスムーズに行えるようになるのではないだろうか.
 更に,今回は色に違いがあったことや実環境であることから輝度の変化に強いものといったように,色特徴量とHOG特徴量のみしか検出に使わなかったが,今回話だけでも触れたようなテクスチャ特徴量やLBP特徴量なども用いて検出を行い,それらの結果の評価と比較を行いたいと考える.
 そして最終的には,目的であったつくばチャレンジ公園内の走行可能エリア推定として,比較した中で最も向いているであろう手法を用いてプログラムを作成し,実際につくばチャレンジにて使用したいと考える.

参考文献

[1]安達 美穂, 単眼カメラを用いた意味的領域分割に基づくビジュアルナビゲーション, TSUKUBACHALLENGE2019参加レポート集 , pp.105~110, 2020

[2]棟本 真弘, Convolutional Neural Networkを用いた通路認識と分岐検出に基づく自律走行, TSUKUBACHALLENGE2019参加レポート集 , pp.55~58, 2020

[3]V. Vapnik and A. Lerner, Pattern recognition using generalized portrait method, Automation and Remote Control, 24, 1963

[4]Ioannis Tsochantaridis, Thorsten Joachims, Thomas Hofmann, Yasemin Altun, Large Margin Methods for Structured and Interdependent Output Variables, The Journal of Machine Learning Research 6, pp.1453-1484, 2005

[5]N. Dalal and B. Triggs, Histgrams of Oriented Gradients for Human Detection, Proc. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.886-893, 2005

[6]Chew GOH Hock GOH, 吉田 俊之, 酒井 善則, Image retrieval method based on color histogram, 信州学会秋季全国大会, 1995

[7]OpenCV : http://opencv.org/


添付ファイル: fileP2.png [詳細] fileT1.png [詳細] fileR1.png [詳細] fileP1.png [詳細] fileM2.png [詳細] fileM1.png [詳細] fileL2.png [詳細] fileL1.png [詳細] fileK4.png [詳細] fileK3.png [詳細] fileK2.png [詳細] fileK1.png [詳細] fileH1.png [詳細] fileG1.png [詳細] fileC1.png [詳細]

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2021-03-24 (水) 20:32:16