AI人工知能の「知識」時代

Table of Contents

Table of Contents

探索・推論の時期に、知識や経験の構築で探索コストを削減できて、精度も上げるし、実用性の可能性も出てきた。
そのため、知識のデータベースを構築する必要も出てきた。


知識のデータベース

膨大なデータベースがあれば、ある程度の範囲内の問題をコンピューターに質問して、答えが出てくるシステムが開発された。特に会話をシミュレーションするシステム。例えば、イライザ(ELIZA)というプログラムは自然な感じで人間と対話を行える。
ただ、コンピューターが会話の本当の意味を理解できるわけではなく、パターンに応じて答えを出すだけ。このようなプログラムは
人工無脳
プログラムと呼ばれる。

イライザ効果
人工無脳のプログラムと会話している時に、本物の人間と会話しているような錯覚。


エキスパートシステム

専門家の知識も蓄積できたら、どうなる?専門家みたいなシステム(エキスパートシステム)を作るも可能になるでしょう。

Dendral

スタンフォード大学で開発した未知の有機化合物を特定するエキスパートシステム。

MYCIN

同じくスタンフォード大学で開発した血液中のバクテリアを診断し、処方するまでできるエキスパートシステム。


知識ベースを構築する問題

  • 膨大な知識があって、一貫性はないもの、矛盾なものを整理するのも難しくて、ベースの保守は大変。
  • 専門家から知識獲得するのは容易ではない。
  • 知識の共有と再利用も問題になる。

問題を解決するため、知識を整理方法、処理方法などの研究を行っている。その中に意味ネットワークオントロジーがある。

解決の研究: 意味ネットワーク

人間の記憶構成の一種を表すためのモデル。概念を表すノート意味関係の矢印で構成したネットワーク。

  • 概念: 上位概念下位概念がある。矢印で表すと「下位→上位」になる。例えば、人間-(is a)->哺乳類
  • 意味関係: is-aという継承関係、part-ofという属性関係がある。例えば、手-(part of)->人

○: 意味ネットワークの効果は、人間にとってわかりやすい、関連する知識の検索をしやすい。
✖️: 意味ネットワークは関係を表現するのが良いだが、記述の決まりはないので、共有するのはできない。

解決の研究: オントロジー(ontology)

オントロシーは「概念化の明示的な仕様」という定義がある。目的は知識の共有と活用

記述を統一しないと、色んな言葉での記述が出てくるので、共有と活用のハードルが高くなる。そのため、統一した記述で行う研究を進んでいる。その中に、全ての一般常識を蓄積するCycプロジェクトは1984年からスタートされた。セマンティックWebLinked Open Dataという研究も展開されている。

場合によって、オントロジーはヘビーウェイトオントロシーライトウェイトオントロシーがある。

ヘビーウェイトオントロシー
この場合だと記述の正当性の考察が必要のため、時間がかかる。Cycプロジェクトが30年以上経って未だに終わっていない。

ライトウェイトオントロシー
使える程度で良い場合なので、厳密に正当性の考察をする必要はあまりない。ウェブマイニングデータマイニングで利用されている。