WebスクレイピングやWebクローリングを行う際の注意点の一つとして、著作権法に触れないように注意することが挙げられます。では、なぜ著作権法が関係あるのでしょうか。今回は、WebスクレイピングおよびWebクローリングと著作権法との関係をテーマに、著作権を侵害するケースや注意点を解説します。
WebスクレイピングやWebクローリングと著作権法はどのような関係があるのでしょうか。まずはWebスクレイピングやWebクローリングの意味から確認しておきましょう。
Webスクレイピングとは、プログラミングされたクローラーと呼ばれるロボットが、Web上の情報を収集し、必要な情報を抽出する手法のことです。主に大量の情報収集の目的で行われています。
また、クローラーがWebページのリンクをたどりながらWebサイトを巡回し、Webページにある情報を保存・収集することをWebクローリングと呼びます。
Webスクレイピングは、特定のテキストや画像など必要な情報を抽出する行為を指しますが、WebクローリングはWebサイト全体の情報を収集する行為を指します。
近年は、データや情報の価値が高まっており、Webスクレイピングを行って、データ収集や分析を行う企業も増えてきました。例えば、商品の価格やレビュー、企業情報、ニュース記事などを収集し、市場変化や競合他社の商品やサービスの価格や性能の比較などに活用しています。
ShtockDataを導入いただいた企業様の事例を1冊にまとめました。ShtcokDataを導入した成果や現場での活用法のリアルをお届けします。
著作権とは、著作権法に定められている著作物を保護するための権利のことで、著作物とは、人が自分の考えや気持ちを作品として表現したもの全般を指します。
これらの保護を目的としている法律が著作権法です。その著作権法では、著作物について「思想又は感情を創作的に表現したものであって、文芸、芸術、美術又は音楽の範囲に属するもの」と定義されています。
著作物を生み出す著作者の努力や苦労に報いることによって、日本の文化全体が発展できるよう、著作物の正しい利用をうながし、著作権を保護するために著作権制度は存在しています。
では、Web上に掲載されている著作物にはどのようなものがあるでしょうか。主に以下のような種類が挙げられますが、これ以外にも無数の著作権コンテンツが存在します。
言語の著作物:講演、論文、レポート、小説、脚本など
音楽の著作物:楽曲、楽曲を伴う歌詞など
美術の著作物:絵画、マンガなど
写真の著作物:肖像写真、風景写真、記録写真など
プログラムの著作物:コンピュータ・プログラム
出典:文化庁「令和5年度著作権テキスト」
https://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/pdf/93726501_05.pdf
WebスクレイピングやWebクローリングで情報を収集すると、著作権のあるコンテンツが含まれることがあります。こうした著作物のデータを自社のサーバやパソコンなどに保存し、利用する行為は、著作権者の同意がない限り、基本的には著作権侵害になります。
WebスクレイピングやWebクローリングを実施する際に、著作物を正しく取り扱わなければ、著作権侵害に当たり、違法になることがあります。
著作権法では、収集した著作物を含むデータを著作権者の許諾なしに公開、保存、譲渡、販売することは禁止されています。 つまり、上述の著作物を許諾なしに取得して公開・販売し、収益を得るといった行為は著作権侵害の恐れがあります。
一方で、著作権法では一定の例外的な場合に著作権者などに許諾を得ることなく利用できることも定めており、「権利制限規定」と呼ばれます。条約によって許される範囲内で「例外規定」が数多く設けられており、この例外規定が適用される場合には許諾を得ずに著作物を利用できますが、目的外で著作物を使用することはできません。
Webスクレイピング・Webクローリングに関連する例外規定としては、「情報解析」についての言及です。以前は「情報解析のための複製等」といった規定があり、ここでの「情報解析」は大量の情報から言語、音、映像などを抽出し、比較・分類といった統計的な解析を行う手段に限定されていました。しかし、2023年5月に著作権法改正が行われ、柔軟性の高い規定に再整備されました。例えば、「著作物に表現された思想又は感情の享受を目的としない利用(新30条の4)」においては、以下のような言及があります。
IoT、ビックデータ、人工知能などの技術革新やデジタル化・ネットワーク化の進展を踏まえ、著作物等の市場に悪影響を及ぼさない一定の著作物等の利用に関する場合について規定した例外です。以下の条件を満たす場合には、いずれの方法によるかを問わず、著作物を利用することができます。
【条件】
1. 次に掲げる場合その他の著作物に表現された思想又は感情を自分で享受したり、他人に享受させたりすることを目的としない場合であること
- 著作物の録音・録画等の技術の開発又は実用化のための試験の用に供する場合
- 情報解析の用に供する場合
- 上記のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を利用に供する場合
2. 必要な限度内の利用であること
3. その著作物の種類や用途などから判断して、著作権者の利益を不当に害さないこと
引用:文化庁「著作者の権利の制限(許諾を得ずに利用できる場合)」
https://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/pdf/93736501_11.pdf
つまり、Webスクレイピングで収集した著作権が認められるコンテンツの情報解析を行う場合に、パソコンやサーバに保存して解析を行うことは問題ないということです。上述の「例外規定」の目的外では利用してはいけません。
※出典:文化庁「著作権法の一部を改正する法律 概要説明資料」
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/bunkakai/51/pdf/r1406118_08.pdf
Webスクレイピング・Webクローリングと著作権法を侵害しないための対策を確認しておきましょう。
前もって、Webスクレイピングを実施する目的を社内で確認しておくことをおすすめします。先述の通り、著作物を含むコンテンツを収集する場合には、情報解析を目的とする必要があります。著作権法違反にならない利用範囲についても社内で共有しておかなければなりません。知らずに法律に抵触していたということがないようにしましょう。
目的だけでなく、Webスクレイピングを実施する対象についても検討しましょう。例えば、著作権のない文章や画像などを対象とすれば、著作権侵害にはなりません。また、対象となるWebサイトの情報に著作権が認められるものが含まれているかどうかを事前に確認しておくことも重要です。
WebスクレイピングやWebクローリングに限らず、業務上、コンテンツを取り扱う場合は著作権に関する知識を社員全員が持っておくことは重要です。社員に対して、著作権法で保護されるコンテンツとはどのようなものなのか、また著作物を無断使用するなどの著作権法違反になる行為はどのようなことなのか、どのような罰則や損害があるのかといった基礎知識を習得するための研修を行うのも必要でしょう。
著作権法違反になっていないか不安がある場合は、弁護士などの法律の専門家にチェックやアドバイスしてもらうなどすることも一案です。
ShtockDataを導入いただいた企業様の事例を1冊にまとめました。ShtcokDataを導入した成果や現場での活用法のリアルをお届けします。
Webスクレイピング・Webクローリングと著作権法との関係をご紹介しました。WebスクレイピングやWebクローリングはWeb上の情報収集を効率的に実施できる手法である一方で、収集する情報には十分な注意と配慮が必要になります。ぜひ適切な実施を心がけ、有益な情報収集を行いましょう。
著作権に注意しながらWebスクレイピングを効率的に行うのであれば、Webクローリング&Webスクレイピングサービスの「ShtockData」がおすすめです。ShtockDataは、Webサイトを周期的にクローリングし、Webページ上のデータを抽出、収集するサービスです。データは、お客様の要望に応じた形式 に変換され、クラウド上のデータウェアハウスに格納され、利用することができます。
ShtockDataの導入企業の声として、「人による情報収集などの作業が不要になり、情報収集が自動化できたことによるコスト削減のメリットがあった」と多く寄せられており、コスト削減をご検討されている場合にもおすすめです。
機能や特徴など、ShtockDataについて1冊にまとめました。Webサイト上に記載していない情報まで集約しています。ぜひお気軽にダウンロードしてみてください。
平成12年11月22日
6,700万円
小林 一登
105-0003 東京都港区西新橋一丁目8番1号 REVZO虎ノ門4F
03-6384-5911
9:00〜18:00(JST)
自然言語処理エンジンの研究開発
ビッグデータの収集・整理・蓄積・可視化
ルーチン業務の自動処理システム提案
共同ピーアール株式会社/ 株式会社ファーストリテイリング/ アデコ株式会社/ カシオ計算機株式会社/ 日本放送協会/ 株式会社ZOZO/ 株式会社東芝/ パナソニック株式会社/ 株式会社リクルート住まいカンパニー/ 総務省統計局/ 中部国際空港株式会社