日本が機械学習パラダイスなのは情報大航海プロジェクトのおかげ

人工知能じゃ〜これからはシンギュラリティじゃ〜と盛り上がっており、猫も杓子も深層学習で人工知能で人類皆失業などと楽しいお祭り、ぼくは嫌いじゃない。我々が生きていくためには金が必要なんだ。というわけで、ちょっと気になって調べたことがあったのでここに記録しておく。もしこれが知財や法曹方面の業界で有名な話だったらコンピュータエンジニアたち何やってんのという話ではある。


もともとこれが気になっていた。ので調べました。という話。


著作権法

とりあえず原文を引用しておこう。

第四十七条の七 著作物は、電子計算機による情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の統計的な解析を行うことをいう。以下この条において同じ。)を行うことを目的とする場合には、必要と認められる限度において、記録媒体への記録又は翻案(これにより創作した二次的著作物の記録を含む。)を行うことができる。ただし、情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。
(電子計算機における著作物の利用に伴う複製)

これを解釈すると日本は機械学習パラダイスだというわけだ。まあ確かにそうとしか読み取れないわけだが、本来の目的とか設立趣旨を知っておかないとあとの法解釈で死ぬだろう。というわけでヒマだしネットサーフィンをしたわけだ。この47条の7は平成21年の著作権法改正で追加された条文で、解説文書も文化庁のページからPDFながら公開されている。この解説文に

今回の著作権法改正は,議員立法や他法制定に伴う整備を除けば,平成 18 年(中略)以来の改正となるものである。改正事項は多岐に渡るため,個
別の改正事項ごとの経緯を述べるには紙幅に余裕がないが[1],全体の経緯は次のとおりである。

とあり、注釈に「 個別の改正事項ごとの検討経緯については,平成 21 年1月の著作権分科会報告書を参照されたい」とある。なので、この著作権分科会報告書を参照する。 これを見つけるのにいろいろ検索クエリを工夫した結果、文化審議会著作権分科会(第27回)議事録・配布資料を見つけることができた。で、これをみても著作権法47の7に直接関係しそうなところがない。が、つらつら見ていると次回の文化審議会著作権分科会(第28回)議事録・配布資料に、それらしきものがある。 「著作権法に関する今後の検討課題」(平成17年1月24日・著作権分科会決定)の概要とそれ以降のこれまでの審議状況というやつがそれで、これをみると4ページに

  • 概要: 画像・音声・言語・ウェブ解析技術等の研究開発における情報利用の円滑化のための法的課題の検討(知財計画2008)
  • これまでの審議状況等: 平成21年法改正案提出中(第47条の7の新設)

と書かれている(表の引用が面倒なので適当に書式を変更した)。これだ!!

というわけで、経緯が書かれているという資料1-2の文化審議会著作権分科会報告書(案)に戻ると、の第1編第3章第6節「研究開発における情報利用の円滑化について」が該当する。検討の背景の序文を引用しよう。

政府の知的財産戦略本部では、高度情報化社会の下、インターネット上の膨大な情報等から情報・知識を抽出すること等によりイノベーションの創出が促進されるとの観点に立ち、情報アクセスなどネットワーク化のメリットを最大限に活用できるような環境整備の必要性が認識されている。そして、本年6月に同本部で決定された「知的財産推進計画2008」においては、まず、それらの情報処理のための基盤的技術となる画像・音声・言語・ウェブ解析技術等の研究開発に関して、この研究開発の過程で行われる情報の利用について著作権法上の課題があることを指摘し、早急に対応すべき旨が盛り込まれたところである。

つまり知財戦略本部=政府からのお達しでイノベーションを促進するために著作権法をなんとかせいと言われているわけである。知的財産計画2008はまだ読んでないけど、それっぽい目次があるようだ。P26に

ネット等を活用して膨大な情報を収集・解析することにより高度情報化社会の基盤的技術となる画像・音声・言語・ウェブ解析技術等の研究開発が促進されること等を踏まえ、これらの科学技術によるイノベーションの創出に関連する研究開発については、権利者の利益を不当に害さない場合において、必要な範囲での著作物の複製や翻案等を行うことができるよう2008年度中に法的措置を講ずる。

情報大航海プロジェクト

こんどは情報大航海プロジェクトについて見てみよう。検索したら平成19年の「情報大航海プロジェクト」についてという資料がみつかった。平成19年は2007年だ。まあパワーポイントなのでポンチ絵なのだが、P3には「制度・環境」と題して「プライバシー、著作権を始めとする制度的課題について、法改正やルール整備等の所要の手当てを処置」と書かれている ((ちなみにP4には将来のIT化社会の未来像みたいなのが語られているが、なんだか昔も今も似たようなことやっとるんだなあと感慨に浸ることができる名文である)。さらに、2008年のJapioの雑誌?機関紙?には「情報大航海プロジェクト2年度目を迎えて」という文章が寄稿されている。これを見ると

今後web情報における現在の検索エンジンにとどまらず新サービスが開拓される実情について、文化庁・経産省で大航海プロジェクトにも参加するベンチャー企業への共同ヒアリングを実施、文化庁へのパブコメにも意見を提出、著作権審議会法制小委員会にて著作権法改正の方針が固まったことは、こうした利用が可能となっている諸外国並に日本の法的環境が進捗するだけではなく、さらにどのような環境を整備していくのかに内外関心を集めることになるであろう。

と書かれており、情報大航海プロジェクトの関係者が文化庁に働きかけたことがわかる。だってここをクリアしないと検索エンジンも作れないもんね。当時某プロジェクトで微妙に検索エンジン経由でそういう噂も聞いていたので、まあそうなるわなー。当時は役人仕事しろって思うけど、今思うとお役所頑張ったな!と感慨深いものがある。

改正著作権法の解説から合わせて考えると、まず検索エンジンがクローリングして集めたWebサイトや文章、音声、動画などのデータを検索エンジン事業者がそのまま国内で保存していたら著作権法上の複製にあたりそうだから、ちょっと法律関係をちゃんと整備しないといけなくなった…おそらく2006とか2007年の情報大航海プロジェクトの企画時にはわかっていたことだと思う。当時すでに国産の検索エンジンは何社もあったわけだし(当時の事業者は基本的にクロールしたデータはインデックス作成後すぐに消していたようなので、心配はしていたがそんなに問題にはなっていなかった?)。ところがグーグルが登場して技術の流れが変わって法整備ちゃんとしようということになったので、政府にプロジェクト関係者が働きかけて法改正に持っていったものと推測できるわけだ。

改正著作権法の解説

情報大航海プロジェクトと改正著作権法の関連を示すものとしては、改正著作権法の解説というページからリンクされている解説が非常にわかりやすい。公式見解ではないと前置きしつつも、どう考えても全員関係者です、という非常に味わい深い資料なのであるが、6-20をみると面白い。

法47条の7により認められる複製等によって情報解析を行い、その結果を他人に提供するサービスを実施したいと考えているが、どのようなサービスであれば問題ないか。

という問題だ。深層学習関係に敷衍すると、GANによる自動生成なんかが主に関係するだろう。ここでは、『ネガティブ4割、ポジティブ6割」は、上記の「情報解析結果のデータ」に』と書かれているように、別の記号やキーワードなどに抽出された統計情報ならOKとしか書かれていない。そして、49条で「第47条の7に定める目的以外の目的のために、同条の規定の適用を受けて作成された二次的著作物の複製物を用いて当該二次的著作物を利用した者」は、「当該二次的著作物の原著作物につき第27条の翻訳、編曲、変形又は翻案を行つたものとみなす」と書かれている。GANによる生成は統計情報の抽出なり利用を人間は全くやってないので、はてこれは新たなグレーゾーンなのでは…と心配できたりするわけである。

もちろんほとんどのケースでは元のデータが分からないくらい多くミックスされているわけで、人間の全ての創作活動が既存の作品の模倣とアレンジ、組み合わせであると主張する立場からはコンピュータと人間がやるのでは大差ないという話になるかもしれない。あるいは、創作側が「人間に見せるのはOKだがコンピュータに見せるのはNGだ」と言ってしまえば話はそれで終わるかもしれない。

まあそもそも件の記事の上野達弘氏は経歴をみるに文化審議会著作権分科会の小委員会を何度も歴任しているし、知財戦略本部にもおられたようなのでどうみても関係者(か、限りなく現場に近い)だったのであろう。知ってる人は知ってる話というだけの話だ。

まとめ

  • 著作権法47の7は2008年の政府の知財戦略の成果のひとつであり、たまたまそこにあったわけじゃない
  • 改正に関する経緯を追っていくと情報大航海プロジェクトの働きかけがあったことが分かる
  • あれくらい大きなプロジェクトであれば法改正もできるということだ!!感謝しよう!!敬え!!
  • とはいえ深層学習を応用した生成系のタスクについては著作権的に悩ましいところもまだありそう


参考

  • 高田寛, 情報大航海プロジェクトと検索エンジンの法的問題についての-考察, 比較法制研究(国士舘大学)第31号(2008)129-168