#contents
概要 †
https://gdgkobe.doorkeeper.jp/events/35189
TensorFlowを趣味に活かしてみる †
有限会社シーリス 代表
有山 圭二 様
参考 †
- TensolFlowでアニメゆるゆりの製作会社を識別する
- ディープラーニングでおそ松さんのむつ語を識別する
1キャラあたり画像枚数600〜1000枚位を学習に
example/android †
- カメラに何が移ってるかリアルタイムに識別
- 開発環境-Bazel
→ Googleの最新型のビルドシステム
モデルの学習データは別途落としてきて、アセットフォルダに入れる。
- アプリ側
プレビュー画像の中央224pxを抜き出してTensorFlowに渡してる
- JNI側
YUV <->ARGBに変換している
TensorFlowの将来 †
- モデルデータさえあればオフラインで使用できる
- モデルデータの作成が出来れば新しい物体や認識の改善が出来たりする
- ネットワークでモデルデータを落としてくることもできる
ほか †
同人誌 †
- 東シ-58a TechBooster
- 東ム-39b O2 Project
Q&A †
- Android認識でうまい事いったケース
キーボードとかモニターとか
特徴的なパターンが出てくるのは認識しやすい
- 人は?
やってみる。
→ 厳しそう。学習データの問題?
- モデルデータの作成はできるのか
できる。
- トレーニングデータ自体は作成して認識に回すのは出来る。
.pbファイルの作成方法は未公開。.pbファイルはAndroid等で動かすのに必要。
Cloud Vision API and TensorFlow †
Sato Kaz
GCP - Google Cloud Platform †
- GCPってなに?
The Datacenter as a Computer
データセンター全体を1つのPCとして扱う
- 回路や基盤もGoogleが作成している
→ 低レイテンシーネットワークを実現
- Borg
- Google Brain
Large Scale Deep Learning - Jeff Dean
実用化されている
- Google Photoの画像分類とか
- Google検索の結果とか
- Androidの音声認識
- OCR
- テキストの分析
- Deep Learningの分散化問題
Deep Learningは小数点演算。
Cloud Vision API †
- 内部ではDeep Learningが動いている。
- 画像認識のAPI。
顔認識。感情とかも。向いている方向、感情をで取得できる。
物体認識。休日?とかも
ランドマークなら位置も。
OCR。手書きでもある程度は認識できる。
セーフサーチ。
レイテンシー1秒くらい
jsonで返ってくる
- 画像を送るだけで認識するので、学習させる手続きが要らない。
DeepLearningについて詳しい知識がなくても
- 自分で学習させれない。工場の新製品チェック等。それはTensorFlowで。
TensorFlow †
1次元-Vector, 2次元-Matrix, 多次元-Tensor
多次元の浮動小数点演算を大量に行うデータフローのフレームワーク
- オープンソースで公開されている分では1台のマシンでしか動かない
- 繰り返し調整していくので、Deep Learningはいかに分散させて高速化するか
→ TensorFlowで分散かけて動かせる(まだ未公開分)
- Googleが使ってるので、Googleの研究者が必要な機能が実装されていく
Q&A †
- TensorFlowはあくまでデータフローなので、画像認識等のDeepLearningは使用者側の責任。
自分で計算式を書くので、知識が深くないと書けない
- DeepLearningのみではないので、それ以外の普通の計算にも使用できる。モンテカルロとか。
FPGAとHPC †
blog:ぱたへね
ハードウェアの話
FPGA:
HPC:ハイ パフォーマンス コンピューティング
FPGAを使ったHPCの話 †
FPGA、メリットは早い。デメリットは多い。
動き検出のSW、HW実装の話 †
MyHDLの紹介 †
NNVS-Verilogの紹介 †