日本古典籍データセット

2類、3類国文学のみなさま。

人文学オープンデータ共同利用センター / Center for Open Data in the Humanities / CODH@ROISでデータセットが無料公開されておりますよ!

たとえば、「源氏」などのキーワードで検索すると、源氏物語の写本のリストが表示されるという仕組みです。画像データで重いのでスマホではなくPCでご覧になった方がいいかも。

 

公開されているデータセットは以下の通りです。江戸時代料理レシピ面白そうですね!

日本古典籍データセット
歴史的典籍NW事業においてデジタル化された古典籍のうち、主に国文研所蔵本を対象に、画像データと書誌データをセットで公開しています。さらに一部の古典籍には作品紹介や翻刻テキストデータ、タグ情報なども付与しています。


日本古典籍字形データセット
日本古典籍データセットで公開するデジタル化された古典籍を対象に、翻刻テキストの制作過程で生まれるくずし字の切り出された字形と座標情報などを、機械のための学習データや人間のための学習データとして提供します。


江戸料理レシピデータセット
日本古典籍データセットに含まれる江戸の料理本を対象に、江戸の料理文化に関するデータとして、翻刻・現代語訳・レシピ化という作業を加えたレシピデータを提供します。