パナマ文書
2016年5月26日 (木) 03:41時点における122.18.176.120 (トーク)による版 (ページの作成:「'''パナマ文書'''(英語:panama paper)とは、脱法ドラッグのようなものの常習者たちを記載したパナマ発の文書のことである...」)
パナマ文書(英語:panama paper)とは、脱法ドラッグのようなものの常習者たちを記載したパナマ発の文書のことである。
概要[編集 | ソースを編集]
パナマの法律事務所Mossack Fonsecaからドイツの新聞社Seuddeutsche Zeitung(南ドイツ新聞)へ、1150万個のファイル、容量にして2.6TBのデータが送られた。その内容が2016年4月初旬に報道され、以来世界中で議論を巻き起こしている。
解析[編集 | ソースを編集]
米ワシントンD.C.に本部を置く国際調査報道ジャーナリスト連合(ICIJ)がパナマ文書の解析を進めている。 ICIJがこの解析で使用しているのが、グラフ型データベース「Neo4j」(Neo Technology社)と、グラフ型データベースに特化したデータの発見および可視化ソフトウェア「Linkurious」(Linkurious社)だとされる。
ICIJ公式サイトにてNeo4jで解析されたデータがcsvファイルとしてBitTorrentで配布されている。 手作業も多かったようで日本語の地名などには誤字も多いようである。
- 配布サイト: https://offshoreleaks.icij.org/pages/database
- Torrent : https://cloudfront-files-1.publicintegrity.org/offshoreleaks/data-csv.zip.torrent
非公式であるが上記のcsvファイルをPostgreSQLにぶち込んでpg_dumpしたものを作ってみた。 オリジナルの誤字などは直していない。 修正するのであればオリジナルは保持したまま、修正用データを格納するカラムを作るのが良いと思われる。 また、インデックスはほぼ貼っていない。