ラフルズプレイス > #4

彼ら3人は経済記事を読んでいた。
Huang Jianhua
パトリック、この論文の重要な部分を説明しましょう。
Patrick O'Leary
もちろん、ファン。私が理解できる言葉で説明してください。
Huang Jianhua
この論文は、アメリカンストーリーズと呼ばれる歴史的なアメリカの新聞の大規模なデータセットについてです。
Patrick O'Leary
「大規模なデータセット」とはどういう意味ですか?
Huang Jianhua
それはこのデータセットには膨大な量のデータが含まれていることを意味します。新聞のスキャン画像が約2000万枚含まれています。
Patrick O'Leary
わあ、それはたくさんですね!
Huang Jianhua
はい、そうです。研究者たちは深層学習パイプラインを使用して、新聞の画像から全文記事のテキストを抽出しました。
Patrick O'Leary
深層学習って何ですか?
Huang Jianhua
深層学習は、データから学習して予測を行ったり、タスクを実行するための人工知能の一種です。
Patrick O'Leary
わかりました。
Putri
ねえみんな、アイデアがあるわ!私たちはこのデータセットを誤用してお金を稼ぐことができるわ。
Huang Jianhua
誤用?それは良いアイデアとは言えませんね。
Putri
でも考えてみて。私たちはこのデータセットを使ってセンセーショナルな新聞を作り、たくさんの注目と広告主を集めることができるのよ。さらに、カルト宗教団体から大きな投資を得ることさえできるわ。
Huang Jianhua
プトリ、あなたが提案していることには倫理的な懸念があります。データを責任を持って使用し、個人的な利益のために操作しないことが重要です。
Putri
でも私は成功してたくさんのお金を稼ぎたいの!
Huang Jianhua
成功とお金は人生で重要なことだけではありません、プトリ。財産以外にも他の価値や意味があります。
Patrick O'Leary
ファンが正しいよ、プトリ。私たちは常に行動の倫理的な影響を考慮するべきです。
Weeks Pass
(数週間が経ち、シーンが変わる)
Putri
ファン、私は危機に陥っているわ!私の新聞事業は訴訟、事故、契約停止に直面しているの。
Huang Jianhua
私はリスクについて警告したのに、プトリ。あなたは聞かなかったのですね。
Patrick O'Leary
ファン、私たちはプトリを助けるために何かしなければなりません。
Huang Jianhua
わかっています、パトリック。私はしぶしぶ危機を解決しようとします。
Huang Jianhua
でも覚えておいて、プトリ、成功は道徳と倫理の犠牲になってはいけません。
Patrick O'Leary
ファン、なぜこの論文が重要だと思いますか?
Huang Jianhua
この論文は、歴史的な英語と歴史的な世界の知識をより良く理解するために使用できる高品質なデータセットを提供するため重要です。また、トピックの分類や複製コンテンツの検出など、さまざまな社会科学の応用にも利用できます。
Huang Jianhua
しかし、さらに重要なのは、成功はお金だけではありません。知識と資源を責任を持って使用し、他人の幸福を考慮することです。
ファンの言葉で会話は終わり、みんなに貴重な教訓を残します。

Title: American Stories: A Large-Scale Structured Text Dataset of Historical U.S. Newspapers
Authors: Melissa Dell, Jacob Carlson, Tom Bryan, Emily Silcock, Abhishek Arora, Zejiang Shen, Luca D'Amico-Wong, Quan Le, Pablo Querubin, Leander Heldring
View this paper on arXiv