データセット
研究に使えるデータセットです.
テキストデータ
青空文庫
情報学研究データリポジトリ
(NII)
言語資源カタログ
(言語資源協会)
LDC - Linguistic Data Consortium
Tweets2011
…TREC 2011 microblog trackで使用されたツイートデータセット.
言語処理学会論文誌LaTeXコーパス
…言語処理学会の「自然言語処理」に掲載された論文のLaTeXソースファイルです.
国立国会図書館書誌データ
辞書,シソーラス,対訳データ
日本語WordNet
つつじ:日本語機能表現辞書
公開資源 - 東北大学 乾・岡崎研究室
…自然言語関連ツールやリソースの公開(日本語評価極性辞書を含む)
形態素解析ツールの品詞体系
…Juman品詞体系とChaSen品詞体系(IPA品詞体系)の一覧表
日本語対訳データ
共通語彙基盤 コア語彙2.0(検証版)
…IPAが公開する氏名、住所、組織等、あらゆる社会活動で使用される中核的な用語の集合.
MFD
…道徳基盤理論辞書(Moral Foundations Dictionary)
J-MFD
…道徳基盤理論辞書(Moral Foundations Dictionary)の日本語版
ネットワークデータ
Network data
…ネットワーク分析用データセット.GMLフォーマット.
Network Data Repository
…University of Californiaが公開しているネットワーク分析用データセット.
Stanford Large Network Dataset Collection
…Stanford大学が公開している巨大なネットワークのデータセット.
The Colorado Index of Complex Networks (ICON)
…Colorado大学が公開している研究用のネットワークデータセット.
Enron Email Dataset
…Enronの電子メールのデータセット.
Twitterネットワークの可視化(よしなしごと)
…Twitterの私的なデータセット.
機械学習データ
UC Irvine Machine Learning Repository
ソーシャルメディアデータ
D-Ocean
…ソーシャルメディアのデータ配布サービス
地図・地理データ
位置参照情報ダウンロードサービス
…国土交通省国土政策局国土情報課が公開している街区レベル位置参照情報データ.
基盤地図情報サイト
国土交通省の国土地理院が公開している基盤地図情報データ.
OpenStreetMap Japan
OpenStreetMapデータモデル
…OpenStreetMapのデータ形式
疑似人流データ
人流・物流データ
データの提供
(東京都市圏交通計画評議会)…パーソントリップ調査と物資流動調査データの提供
風間 一洋