特許の情報をダウンロードする方法

商標速報bot知財ラボみたいに特許や商標の状況を収集・分析してみたいと思ったことはありませんか?特許庁の特許情報検索プラットフォームJ-PlatPatがありますが、これは1つずつ検索・表示しなければならないのですが、実は特許庁は他にも情報提供のツールを用意してくれています。

インターネット利用による公報発行サイト

https://www.publication.jpo.go.jp/

公開公報、特許公報など、特許庁が発行する公報のデータをまとめてダウンロードできるサイトです。ZIPファイルかTARファイルでダウンロードできます。

中身の形式は大きく分けて2パターン。特許や実用新案はXML形式、意匠や商標はSGML形式です。
仕様も特許庁のサイトに掲載されています。

特許情報標準データ

https://www.jpo.go.jp/system/laws/sesaku/data/keikajoho/hyojundata-tekyo.html

特許庁のマスターデータの更新データ(差分データ)のような形で提供されます。依頼すれば過去データをもらうこともできるようです。(外付けHDDを渡して入れてもらうとか)
2019年5月にリリースされたサービスで、私もさっそく申し込みました。申し込みはリンク先にある問い合わせフォームから依頼して、メールで申込書をやり取りする形でおこないます。

正式には特許情報バルクダウンロードサイトというサービスを利用するようで、なんとこのサービスはURLを見るとJ-PlatPatのサブシステムのような位置づけのようです。J-PlatPatの内部データをエクスポートするようなイメージなんですかね。

データの仕様はこちらも特許庁のサイトで公開されています。

関連書籍


特許情報処理:言語処理的アプローチ (自然言語処理シリーズ)

特許情報のテキストマイニング―技術経営のパラダイム転換