対談記事(12):Tokkyo.Ai株式会社、ChatGPTを利用した特許生成AI・検索AIツールについて


Tokkyo.Ai株式会社 取締役COO平井智之様、工学博士(前)、弁理士(町田)弁護士(松岡・星野)が対談

対談の概要:11月に行ったセミナーで解説されたTokkyo.Ai のサービスについて詳細に解説していただきました。

1.Tokkyo.AI及びプライベート特許検索(生成、検索、分析)の説明

松岡:本日はお時間をいただきありがとうございます。読者のために、貴社、及び貴社の製品のご紹介をお願い致します。

平井:承知いたしました。弊社(Tokkyo.Ai株式会社)は、2021年に設立された会社であり、「知財の大衆化、知財の運用・活用を通じ知価経済社会に貢献する」ことを主要な目的としています 。具体的には、事業に関わる知財部門や研究開発部門の方、広くは経営に直接かかわる方に弊社のツールを利用していただいて、イノベーション創出や発明保護のためのにお役に立てればとしたいと考えています。
弊社の主力製品は「プライベート特許検索」です。この製品により、特許明細書のドラフト、先行技術調査、技術の用途の探索などを容易にしていただくことができると思います。

松岡:承知いたしました。「プライベート特許検索」には、AIを活用されているとお伺いしました。「プライベート特許検索」にフォーカスしてご説明をお願いします。

平井:AIにより特許調査などを支援するというサービスですけれども、我々が追求しているのは、効率性と安全性という一見矛盾するようなところをテクノロジーを使ってバランスさせることです。
「プライベート特許検索」は、特許に関する「生成」「検索」「分析」を行うことができるツールです。
「生成」につきましては、発明に関するキーワードやフレーズを入力すれば、特許の文案(現状では、60点ぐらい)をすぐに出力することができます。その文案をベースとして、弁理士の先生や知財部門の方々に相談していただくことを想定しています。特許に詳しくない方でも特許の文案を作成し、類似特許の調査までする行うことができますので、特許の専門家と研究開発部門のコミュニケーションギャップを埋めていただくことにもお使いいただけるができるのではないかと考えています。
次に、「検索」についてご説明いたします。「プライベート特許検索」の検索機能は、生成した特許の文案と先行文献と対比することができます。すなわち、AIを使った文章で、類似特許を検索したり、従来型のキーワード検索などと合わせて利用していただくことにより、調査の抜け漏れをなくしていただくことができます。
次に、「分析」についてご説明いたします。「分析」につきましては、比較的簡単に「パテントマップアークセット」や「サイテーションマップ」を出せるようにしています。これまでは、「IPTランドスケープ」のような経営に資するような知財情報の活用を考える際には、かなり長期間検索式を作りこんで、「パテントマップミキマット」を作って、そのレポートを作成するということが一般的だったと思います。そのような緻密な資料ももちろん重要ではありますが、ツールで簡単にざっと全体の俯瞰的なマップを数秒で作成して、まずは大枠をとらえることも重要ではないかと考えており、「プライベート特許検索」の「分析」機能では、簡単な操作でアウトプットを見ることができるようにしています。我々が、上記の機能を有する「プライベート特許検索」ですがの独自性は、2つございます。
まず一つ目は、「プライベート専用環境」です。我々は、検索調査履歴が社外に流出しないというところが非常に重要と考えており、「プライベート特許検索」は、社外に検索式などの特許調査に関する情報を流出させない仕組みにしております。
それだけではなく、専門的なAIを作るための学習データとして、社内環境外に検索情報を蓄積するということもございます。
特定の企業のユーザ様専用の環境をご提供し、そこに検索履歴、検索式などが蓄積され、それを将来的にAIに活用するということも検討しております。
弊社のようなサービスの提供方式はそれほどございません。例えば、他社様は、オンプレミスで提供している会社様もあるようです。この方式によっても社外に情報を流出させないことはできますが、オンプレミスですので、初期費用や維持コストがかなりかかってしまうようです。このような初期費用の負担は、中小企業、スタートアップ企業では難しいので、この点は「特許調査時のセキュリティに高いコストをかけていた」「セキュアな特許検索を行いたかったけれども値段が高くて手が届かなかった」という方々にとって、我々のサービスを利用していただくメリットがあるのではないかと考えております。
「プライベート特許検索」の独自性の2つ目は、弊社独自のビッグデータの処理技術です。我々のデータベースは、低コスト・高効率を実現できる設計となっております。特に、データ量に左右されない設計をしている点がポイントです。日本国内だけで、毎年30万件が出てきます。従来のデータの持ち方の場合、年々、データベースの動きが重くなってしまって、検索の表示上限をつけなければ、適切に動かなくなってしまいます。また、アウトプットを分析することにもかなり時間がかかってしまうこととなります。我々の技術は、ブラウザ上の検索に適しているデータの構築をしております。例えば、我々の検索エンジンを利用すれば、3件の特許の検索結果を出すときと、3000万件の特許を出す秒数がほぼ同じです。これぐらい、ライトに検索結果を出せるデータの処理技術というのが我々の強みとなっています。

2.「プライベート特許検索」とAI

松岡:ご説明いただきありがとうございました。「プライベート特許検索」とAIにつきましてもご説明をお願い致します。

平井:AIについては、2種類ございます。
1種類目は、簡単な文章を入力するだけで、特許請求項の文案に必要な項目をいくつも作ってくれるというものです。
2種類目は、その生成された内容を使って、特許検索をすることができ、類似する特許を出力してくれるという文章検索のAIものです。

松岡:昨年話題となりました生成AIは、1点目の特許の明細の文案を作成するというところで導入されているということでしょうか。

平井:ご認識の通りです。それに関しては、ChatGPTを活用して、我々のシステム内に組み込んだものになります。ChatGPTを利用して特許の文案を作成しようとすると、まず、プロンプトをかなり特殊なものとする必要があります。また、ChatGPTは、専門的なアウトプットは嫌がると思います。我々の場合は、プロンプトの部分を工夫して、そのプログラムに既に組み込んであります。この工夫をすることにより、プロンプトとして何を入力したとしても特許の文案として出力されるようにしております。
AIについてもう1点申し上げますと、ChatGPTのAPIを活用しています。我々は、プロンプトの情報を二次利用しない(AIの学習データとして使わない)というDPA(データを保護するための契約)をOpenAIと締結しています。すなわち、プロンプトが学習データとしては利用されないということは、契約により担保されているということができると思います。

松岡:ご説明いただきありがとうございます。私は特許の明細書を作成したことはございませんので、町田先生にご教示をお願いしたいです。本日ご説明いただきました製品があると、どのようなメリットがあるものでしょうか。

町田:一般的な特許の明細書の作成方法からご説明した方が分かりやすいでしょうね。
通常、発明者の方に「こういう新しいものを作りました」という資料(図面やフローチャートなど)を作ってもらいます。慣れた方の場合、明細書の形式で書いてくださる方もいらっしゃいます。
我々が、発明者の方にお伺いするのは、「従来、どのようなものがありましたか?」ということをお伺いします。そして、発明者の方のご説明や資料から、必要な情報を抜粋して、特許出願のために適切な文章を作成するということが一般的です。

前:私、実は、以前に自分で特許出願のための書類(明細書及び請求項)を書いたことがあります。最終的には弁理士の先生にお願いすることにはなるのですが、明細書は、かなり具体的なことを書く必要がありまして、弁理士の先生に体裁は整えていただきますが、コアとなる部分はある程度自分できちんと記載する必要があって、請求項もどのような部分を権利化したいかという意思はお伝えしなければなりません。私の場合、「プライベート特許検索」のようなツールがないときに作成しましたので、一から自分で作成して、相当大変でした。「プライベート特許検索」があれば、特許の素人であっても簡単に叩き台を作成することができます。最終的に出願するものは、弁理士の先生にお願いするということと思いますが、弁理士の先生にお願いするまでの時間はかなり短縮できると思います。

松岡:ありがとうございます。その前さんの事例を一般化してよいのかどうかについて、町田先生にお伺いしたいと思います。弁理士の先生に持ち込まれる資料は、整理されたものが多いのでしょうか。

町田:いろいろですね。個人の発明者の場合、説明してくれますが、弁理士の方から積極的に聞いていかないと、出願のために十分な情報はいただけないケースが多いように思います。他方、慣れた会社の方の場合や大学の先生など、数多く特許出願をされている方の場合、雛形が定まっていて、それにあてはめて書いていただいているというケースもあります。

松岡:町田先生、ありがとうございます。このタイミングで恐縮ですが、「プライベート特許検索」のターゲット層を教えてください。弁理士の先生でしょうか、それとも、特許を取得しようとする方でしょうか。

平井:結論として、どちらもということとなります。ただ、使い方は異なっていて、弁理士の先生の場合、例えば、お客様からある程度完成された請求項を共有された場合、背景技術を入力して、本来、集中していただくべき請求項クレームツリーや専門的な項目の作成に注力していただくことができると思います。また、例えば、明細書であれば、詳細の説明や実施例に関する、より重要な部分に集中していただくような使用例を想定しています。あとは、すぐに特許調査にも行うことが李陽できますので、AIテキスト蔵書検索と合わせて、弁理士の先生に使っていただきたいと考えております。
一方、とりわけ最近使っていただく人数が増えている、R&Dの方(研究開発者)の場合、ブレストのために「具体例を出力してください」とか、「こういう技術と掛け合わせたらどうなりますか」、とAIと対話する使い方をしてアイディアをブラッシュアップしていただいて、生成された文案を弁理士の先生や社内の知財部門との相談の際にご共有していただくということを想定しております。つまり、弁理士の先生や知財部門と相談する際のコミュニケーションギャップを埋めていただくためにご利用いただけるのではないかと考えています。

松岡:ありがとうございます。星野先生、ここまでの議論についていかがでしょうか。

星野:「プライベート特許検索」を利用すれば、そのまま出願すれば特許を取得することができるというレベルのアウトプットを得ることができるのでしょうか、それとも出願に耐え得るというレベルのアウトプットとなりますでしょうか。

平井:現状は、そのままでは出願はできません。理由は、必要な項目が全て満たされているわけではないからです。例えば、図面もないですし、実施例もいくつか記載しなければなりませんが、そのような項目につきましては、まだ生成することができません。このあたりは、「プライベート特許検索」の開発の際に苦労したことと関係しております。なかなか個別の発明の事情を汲んだ発明の詳細の説明という項目、関連する図面の作図というのは、現状のAIの能力では生成することは難しいところです。詳細な指示を出せば、60点・70点というより、もっと高いレベルの資料を作成することはできますが、そうするとAIを活用した業務効率化というところからは離れてしまいますので。しかし、そのような設計とすれば、裏で動いているシステムのコストが上がってしまうということで、どのようにすべきか悩んでいるところです。
他方、できる点としては、請求項のベースを作成して、すぐに検索をして、仮にそのベースで出願するとすれば、どういう特許とバッティングしうるところが問題となるのかということを検討することができます。この検索結果は、1秒ないし2秒で表示することができます。

星野:ありがとうございます。巷で言われているように、もしかしたら士業の仕事に置き換わることがあるのかもしれないなと思い、聞いてみましたが、そのようなことはなさそうですね。叩き台の作成という利用方法ということについて承知いたしました。士業や知財部の専門家といたしましては、その叩き台の精度を上げていくところに意味があるのだなと考えております。

前:バッティングしそうなものがすぐに分かるというのは、非常にありがたいと思いますね。

3.「プライベート特許検索」の検索機能

松岡:次に、「プライベート特許検索」の検索機能についてお伺いしたいと思います。他の特許に関する検索システムと比較して、「プライベート特許検索」の検索機能の特徴を教えてください。

平井 :我々のAI検索では、検索した文章と類似する記述をもつ特許をベクトルの技術を使って、類似特許の判断をしています。一度、文章をベクトルとして表現して、類似度「〇%」という形で検索結果を表示する点に特徴があります。文章の構成、を計算しています。つまり、矢印が比較的近いもの、サイズが近いもの、類似パーセンテージを出すという仕組みとなっています。2019年頃以降、データベースの応用ができるようになりました。文脈で類似性を判断しますので、キーワード検索や特許分類をつかった検索結果の絞り込みで漏れてしまった特許も拾える可能性があるという点に意義があります。で辞書をしっかりと整理してというようなことをする必要がありませんし、キーワードが遠いものであったとしても、記載・雰囲気が類似しているものを拾うことができるので、構成が類似するという特徴があります。
例をあげますと、弊社の親会社のリーガルテック株式会社が提供している弁護士のマッチングサービスに関する特許の請求項をコピペして、「プライベート特許検索」を利用して検索した場合、もちろん、一番上(最初)に検索結果が表示されるのは、コピペ元となった、弊社の親会社のサービスの特許です。99%の類似性があると表示されています。その下に、93%の類似性がある特許として、「検察・警察の調査に同行することができる弁護士」という、少し限定がかかっています。この限定がありますので、93%となっています。
また、同じ検索結果として、もう少し低い類似率として、オンライン弁護士相談の特許が表示されています。弁護士マッチングとは少し仕組みが違いますので、類似率が下がっておりますが、専門家を求めている方と専門家とのマッチングという部分は共通しているので、検索結果に表示されています。
さらに、社内の法務の情報を共有するサービスの特許ももっと低い類似率として検索結果に表示されています。
また、法律相談の情報システムという一見タイトルだけ見ると類似してそうなサービスが低い類似率として検索結果に表示されています。これは、一見類似率が高くてもよさそうなのにと思いますが、特許の内容を読んでいくと、弁護士の相見積もりを取得するシステムのようであり、先ほどのオンライン弁護士相談とはかなり異なるサービスですので、類似率が下がっています。
上記のように、文脈のところで限定がかかっているかどうかなどを判断して、類似性を示すことができるというのが、「プライベート特許検索」の強みです。文章の記載から類似度を判定する良さというのは、キーワードでは拾えなかったもの、類似率をスコアリングで出せるというところがあります。従来の特許検索を組み合わせて、この文脈を読み取るAIエンジンを利用することにより、検索漏れをなくすことができると思います。
また、スタートアップ・新規事業の会社の方が、特許を検索するということに慣れていない方が、簡単に特許の検索をするということに適しており、実際に利用されています。特許分類での検索というのは慣れていないとなかなか難しいですので。この検索は、GPTとは違うAIを利用しています。

前:この対談記事の読者のために、少し補足します。ベクトル化文章を対比して類似度を出すというのは、ChatGPTなどで使用されているトランスフォーマーというアルゴリズムの中のアテンションという仕組みが、まさにそのどこが文章全体の中で類似しているかという処理を行っております。アテンションの技術のようなものをここに取り入れて検索されているんだろうなと推測しています。
従来の検索システムというのは、キーワード・単語がどれぐらい一致するか、含んでいるかというレベルで検索するものです。

松岡:ありがとうございます。町田先生、この検索の点についてご指摘をいただけますか。

町田:従来の特許検索というのは、キーワードを入れてみたり、特許分類の記号を入れるという、ある意味では職人技的ともいえるものです。つまり、具体的なワードや記号の設定によって、検索結果が異なるものです。ある程度、経験を積まなければ、うまく見つからないという難しさがありました。
このような従来の特許検索は、現在でも必要ではありますが、「プライベート特許検索」の良いところは、自然な文章を入力しても類似したものを出力してくれるというところと思います。従来の特許検索に完全に置き換わるとは思いませんが、うまく補完するという機能になるのではないか、つまり、従来の検索のみであれば漏れてしまうようなことがありますので、より検索漏れを少なくするという使い方ができるのではないかと思います。また、検索に慣れていない人が、簡単に検索するという使い方でうまく棲み分けができるのではないかなと思いました。

前:私から一点お伺いさせてください。この検索については、Tokkyo.Ai株式会社様において、データベースをお持ちなのではないかと推測しております。その場合、日々新しく公開される新しい特許データベースを自社のデータベースに組み込んでベルトル化することが大変なのではないかと思いますが、その点はいかがでしょうか。

平井:ある程度、データベースの更新の自動化をして、効率化しております。ご指摘の通り、データベースの更新にはコストをかけていますね。特許庁がバルクデータを公開していますので、そのデータを自社のデータベースに組み込んでおります。

4.「プライベート特許検索」のセキュリティ

松岡:次に、昨年、生成AIに関して大きな問題となりました、セキュリティについてお伺いさせていただきたいと考えております。本日のご説明の「プライベート環境セキュリティ」のところですね。
特許に関する情報は、他社には知られたくないというのは、強いニーズとして存在すると思います。そのニーズを満たすために、「プライベート環境」を提供されていると思いますが、具体的な内容を可能な範囲で教えていただきたいと考えております。

平井:サービスを利用開始いただくタイミングで、お客様ごとに、環境を分けて仕切って、個別にご提供しております。会社ごとに検索履歴がその環境に蓄積されるという形式となっております。具体的な内容の説明につきましては、セキュリティを弱める可能性もございますので、対外的にはなかなか難しいですこの場では割愛いたします。もし気になる方がいらっしゃいましたらご連絡いただければと思います。

前:先ほどご指摘がございました通り、他社は、オンプレミスでサービスを提供している、つまり、顧客企業内にサーバを置くので、顧客企業の外部に情報が漏えいしませんよということのようですね。ただ、そういう場合、サーバの保守などは別途しなければならないので、労力がかかるということと思います。これに対して、貴社の場合、クラウドベースなので、サーバのメンテナンスという点は、ユーザは意識する必要はないという違いはありますね。そして、貴社としては、データの漏えいも心配しなてくてよいということも両立されているということですよね。

平井:ご説明いただきありがとうございます。ご説明指摘の通りです。

松岡:ChatGPTを利用していますが、情報が漏えいしない仕組みというのは、具体的には、どのような仕組みでしょうか。

平井:ChatGPTのAPIを利用している部分につきましては、OpenAIのサーバを介することとはなります。そのような意味では、社外には出ますが、APIの利用について、弊社は、利用契約書をOpenAIとの間で締結しており、二次利用をしない・学習データとして利用しないという義務をOpenAIに負うことが前提でわせています。この契約上の担保されていまがありますので、情報が漏えいすることはないと考えております。

松岡:ありがとうございます。

前:通信の途中は、SSLなどにより暗号化されていますよね。

平井:はい、暗号化はしております。

前:ですので、途中経路で漏えいするという心配もしなくてよいということと思います。

平井:弊社の親会社・グループは、情報漏えいの調査というサービスを提供しておりますので、弊社自身も情報の秘匿性というのは、かなり気を付けております。

星野:特許法上、新規性・進歩性が特許登録の要件になっておりますので、情報漏えいにより、公知の情報になってしまうと、特許登録できないリスクがあります。このような観点からもセキュリティについては重要と思います。

2024年2月


【過去の対談記事】
対談記事(1):ChatGPTのビジネスの利用について、工学博士と弁護士が対談
対談記事(2):ChatGPT・GPT4の利用とセキュリティなどの問題点について、工学博士と弁護士・弁理士が対談
対談記事(3):対談記事(3):ChatGPTのプラグイン、Midjourneyなどの画像生成AIによる生産性向上
対談記事(4):Midjourneyなどの画像生成AIによる著作権の問題
対談記事(5):イタリアにおけるChatGPTの一時的な利用禁止と各国データ保護機関の動向
対談記事(6):AIと特許・AIによる特許に関する業務の効率化
対談記事(7):ユニアデックス株式会社(BIPROGYグループ。Microsoftの認定パートナー)から、ChatGPTなどの生成AIに関するビジネスの現状と今後のビジネスの展開をお伺いしました(1/2)
対談記事(8):ユニアデックス株式会社(BIPROGYグループ。Microsoftの認定パートナー)から、ChatGPTなどの生成AIに関するビジネスの現状と今後のビジネスの展開をお伺いしました(2/2)
対談記事(9):ChatGPTなどのAIの社内利用による生産性向上(労働時間の減少・人手不足の解消)とリスク対応
対談記事(10):ディープラーニング協会(JDLA)が公表したガイドラインの著作権に関連する項目について検討
対談記事(11):Web版ChatGPTのブラウジング・プラグインの機能とiphoneアプリのChatGPT


AIB協会からのニュースレターのお申込:
AIB協会から対談記事の公開などのお知らせをしています。ご希望の方はこちらから配信先をご登録ください。

ご質問等は、以下にご連絡ください。
人工知能ビジネス創出協会 事務局

対談者ご紹介


Tokkyo.Ai株式会社 取締役COO
平井 智之 (ひらい ともゆき)様

2018年 立教大学大学院修了後、リーガルテック株式会社に入社。法務部や第三者委員会における不正調査業務、海外訴訟における証拠調査業務に従事。
2021年 Tokkyo.Ai株式会社 取締役に就任。


ジャパンマネジメントシステムズ株式会社 代表取締役社長
AIB協会理事 前一樹(まえ かずき)

東京大学大学院工学系研究科博士課程終了・博士(工学)取得。ベルギー・ルーベンカトリック大学研究員、北陸先端科学技術大学院大学助手、ITベンチャー企業取締役、CTOなどを経て、現職。医療系研究会事務局長、元上場企業監査役なども務める。情報処理安全確保支援士(登録番号第002063号)、ITストラテジスト。


弁理士法人磯野国際特許商標事務所 代表社員 弁理士
AIB協会理事 町田 能章(まちだ よしゆき)

早稲田大学大学院理工学研究科建設工学専攻修了。総合建設会社勤務を経て、磯野国際特許商標事務所に入所。2014年4月事務所法人化に伴い代表社員(所長)に就任。AIB協会内外においてAI分野の知財に関するセミナー講師も務める。特定侵害訴訟代理業務付記登録。


  

渥美坂井法律事務所・外国法共同事業 パートナー 弁護士 
AIB協会理事 松岡史朗(まつおか ふみあき)

京都大学法学部卒業、一般社団法人日本DPO協会顧問、ステート・ストリート信託銀行株式会社社外取締役(監査等委員)、「特定利用者情報の適正な取扱いに影響を及ぼすおそれのある外国の制度に関する調査報告書」(総務省)<共著>
https://www.aplawjapan.com/professionals/fumiaki-matsuoka


渥美坂井法律事務所・外国法共同事業 弁護士
星野 真太郎(ほしの しんたろう)

一橋大学法科大学院修了。法律特許事務所勤務後、特許庁模倣品対策室の法制専門官を務め、多数の企業、団体へ知財案件、知財侵害対策に関する助言を提供。
https://www.aplawjapan.com/professionals/shintaro-hoshino


〒150-0031
東京都渋谷区桜丘町18-6 日本会館4階
一般社団法人 人工知能ビジネス創出協会