推奨されます, 2024

エディターズチョイス

Google BrainのTensorFlowについて知る必要があるすべて

Googleフォトを試したことがある人なら誰でも、グーグルが提供するこの無料の写真保存および管理サービスは賢いと思うだろう。 高度な検索機能、場所や日付で写真を分類する機能、類似性に基づいてアルバムやビデオを自動的に作成する機能、数年前の同じ日の写真を表示して思い出に残る散歩を楽しむことができます。 数年前にGoogleフォトでできることは、機械的に不可能なことがたくさんあります。 Google Photosは、TensorFlowと呼ばれる機械学習テクノロジを使用する、Googleが提供する多数の「スマート」サービスの1つです。 学習という言葉は、私たちの現在の知識では想像できないレベルまで、テクノロジが賢くなることを示しています。 しかしTensorFlowとは何ですか? 機械はどのようにして学ぶことができますか? あなたはそれで何ができますか? 確認してみましょう。

TensorFlowとは何ですか?

TensorFlowは、グーグルのオープンソースで強力な人工知能ソフトウェアで 、グーグルの多くのサービスとイニシアチブを強化します。 これは、Google Brainチームによって構築された、大規模な機械学習を実装するためのシステムの第2世代です。 このアルゴリズムライブラリは、DistBelief - 第1世代 - を継承しています。

このテクノロジは、ステートフルデータフローグラフとして計算を表します。 TensorFlowのユニークな点は、消費者レベルのモバイル機器から世界クラスのマルチGPUサーバまで、幅広いハードウェア上で計算をモデル化できることです。 それは、異なるGPUやCPU上で動作することができ、かなりの量のコードを変更する必要なしに、さまざまなデバイスやガジェットの間で機械学習のスケーラビリティを約束します。

TensorFlowは、人間の脳が学習や推論においてどのように機能するかを模倣するように、コンピュータシステムに指示するという Googleの必要性から生まれました。 ニューラルネットワークとして知られるこのシステムは、「テンソル」と呼ばれる多次元データ配列上で実行することができるはずである。最終的な目標は、パターンおよび相関を検出し解読するようにニューラルネットワークを訓練することである。

2015年11月、Googleはこのテクノロジをオープンソースにし 、それをあらゆる種類の製品および研究に採用することを許可しました。 研究者、エンジニア、そして愛好家を含む誰もが、機械学習の成長をスピードアップし、短時間でより高いレベルに引き上げることができます。

独立系開発者からTensorFlowへの寄付が非常に多く、Googleの寄付をはるかに上回るため、この動きは正しいものとなりました。 ウィキペディアは、「GitHubにはTensorFlowに言及する1500のリポジトリがあり、そのうち5つはGoogleからのものです」と述べています 。Quoraの議論の1つは、リリースされたオープンソースコードがGoogleがそのサービスに使用しているもの。

TenserFlowのしくみ

単純な通常の人間の言語と非常に単純化したものを使用すると、TensorFlowの片側を高度な自律フィルタリング技術と見なすことができます。 その中心となるのは、この技術は機械学習の巨大なソフトウェアライブラリです。 それは「決定を下す」のを助けるのにデータベースを使用します。

たとえば、誰かが写真をGoogleフォトにアップロードします。 この技術は、写真からそのデータベースまでのすべての詳細を比較し、それが動物の写真なのか人間の写真なのかを判断します。 それが人間であるならば、それはその人が誰であるかに至るまで性別、年齢を決定しようとします。 写真内の他のオブジェクトについても同じプロセスが繰り返されます。

また、写真をアップロードした個人とすべての人の両方にとって、将来的により良い結果が得られるように、写真内の人物のIDや写真の撮影場所などのユーザーデータを使用してライブラリを強化します。そうでなければ。 したがって、「学習」という用語です。 しかし、それは単に写真からデータを知って学ぶことだけにとどまりません。 この技術が写真からの情報でできることはたくさんあります。 たとえば、同一人物、同じ場所、同じ日付など、詳細が似ている写真をグループ化できます。 顔のパターンを見て、写真に写っている人がどの家族や友達に属しているかを判断し、その情報を使って家族での休暇のビデオや連続撮影のアニメーションを作成します。

これはTensorFlowがどのように機能するかの表面をほとんど傷つけませんが、それがあなたにこの技術の全体像を与えてくれることを願っています。 また、例を1つだけ使用しても、それが可能なことを正しく判断することはできません。

そしてそこにいるすべての人工知能愛好家のために、グーグルが既に機械学習とそれにTensorFlowを統合するために最適化されたコンピュータチップ技術を作成したことは言及する価値があります。 これはTensor Processing Unit(TPU)ASICチップと呼ばれています。

TensorFlowについてさらに学びたい方は、チュートリアルページをご覧ください。

TensorFlowのアプリケーション

私たちは機械学習技術の初期段階にあるので、それがどこに行くのか誰も知らない。 しかし、私たちに将来を覗かせるかもしれない初期のアプリケーションがいくつかあります。 それはグーグルに由来するので、グーグルがそのサービスの多くにその技術を使用することは明らかである。

  • 画像解析の詳細

Googleフォトの画像解析にこのテクノロジを使用する例について説明しました。 しかし、画像解析アプリケーションはGoogleマップのストリートビュー機能でも使用されています。 たとえば、TensorFlowは、画像をマップ座標と結び付け、誤って画像に含まれている車のナンバープレート番号を自動的にぼかすために使用されます。

  • 音声認識

Googleはまた、音声アシスタント音声認識ソフトウェアにTensorFlowを使用しています。 ユーザーが指示を発言することを可能にする技術は新しいものではありませんが、TensorFlowの増え続けるライブラリをミックスに含めることで、この機能は少し向上する可能性があります。 現在、音声認識技術は80以上の言語と異形を認識します。

  • 動的翻訳

機械学習技術の「学習」部分のもう1つの例は、Googleの翻訳機能です。 Googleでは、ユーザーが新しい語彙を追加したり、Google翻訳の間違いを修正したりすることを許可しています。 増え続けるデータを使用して、他のユーザーが翻訳したい入力言語を自動的に検出することができます。 機械が言語検出プロセスに誤りを犯した場合、ユーザーはそれらを修正することができます。 そして機械はそれらの間違いからその将来の性能を改善するために学ぶでしょう。 そしてサイクルは続きます。

  • アルファゴー

TensorFlowの使い方の楽しい例の1つはAlpha Goです。 Goプレイするようにプログラムされているアプリケーションです。 Goに慣れていない人にとっては、それは5000年以上前に中国で生まれた2人のプレーヤーのための抽象的なボードゲームです、そしてそれは今日も継続的にプレイされている最も古いボードゲームです。 対戦相手よりも領土を囲むというルールは単純ですが、ゲームは非常に複雑で、「目に見える宇宙の総原子数よりも多くの可能性を秘めています」とのことです。

それで、学習機械技術が無限の可能性で何をすることができるかは面白いです。 18回のGoワールドチャンピオンであるLee Sedolとの試合で、Alpha Goは5回のゲーム中4回勝利し、Goの名誉最高位を獲得しました。

  • マゼンタプロジェクト

TensorFlowのもう一つの興味深いアプリケーションはMagenta Projectです。 機械制作のアートを制作するという野心的なプロジェクトです。 実験の初期の具体的な結果の1つは90秒のピアノメロディーです。 長期的には、GoogleはそのMagentaプロジェクトを介してより高度な機械生成アートを生成し、その周りにアーティストのコミュニティを構築することを望んでいます。

2016年2月には、グーグルはサンフランシスコでアートの展示会とオークションを開催し、人間の手によるちょっとした助けを借りて29台のコンピュータで生成されたアートを展示しています。 最大の作品のうちの6つは、最高8000ドルで売られました。 本物の芸術家を模倣することができるようになるまでには、コンピュータにはまだ長い道のりがあるかもしれませんが、人々が芸術のために支払っても構わないと思っているお金の量は私たちにどれほどテクノロジーが進んでいるかを示します。

iOSのサポート

Android上でTenserFlowの機能をすでに見てきましたが、その最新バージョンでは、TensorFlowがついにiOSデバイスのサポートを追加します。 iOS専用、またはiOS上で最初にリリースされた多数の優れたモバイルアプリがあるため、近い将来、より多くの優れたモバイルアプリが機械学習を採用することが期待できます。 TensorFlowのより広い採用と応用の可能性についても同じことが言えます。

TensorFlowの未来

学習して独自の決定を下すことができる機械で何ができるでしょうか。 日常生活の一部として複数の言語を扱う人として、私の頭に浮かぶ最初のことは言語翻訳です。 単語レベルではなく、文書や本のように長いテキストレベルではより多くの。 今日の翻訳技術は語彙に限られています。 中国語で「眠っている」とその逆も簡単に見つけることができますが、吉川英治の武蔵の一章を日本語で読み、その章を英語に翻訳してみてください。 私が何をしているのかわかるでしょう。

人工知能の未来が音楽で何ができるかを見るのも楽しいです。 それはまだ非常に基本的ですが、AppleのMusic Memoアプリはすでにあなたの録音した歌に自動ベースとドラムの伴奏を与えることができます。 私はSciFi TV番組のあるエピソードを覚えています。そこでは、番組の中のキャラクターがチャートのトップソングすべてを分析し、それ自身のヒットソングを書くことができるマシンを作りました。 私たちはそこに到着するでしょうか?

そして最後に思ったように、 Sunspringに言及したい。 それはそれ自身Benjaminと呼ばれるAI脚本家によって完全に書かれた短編サイエンスフィクション映画です - そしてそれはポップソングの音楽的な間奏を構成しさえしました。 映画は、ロンドンのSFイベント「48時間映画チャレンジ」のために監督のオスカーシャープによってまとめられました。

今、私はターミネーターについて考えるのを止めることができません。 未来へようこそ。

画像のクレジット:Wikipedia、TechInsider、The Verge、Wall Street Journal

Top