- 2009年7月29日 17:00
著作物の言語データベースKOTONOHAへの採録許諾について(依頼)☆
拝啓時下ますます御清栄のこととお喜び申し上げます。
私ども国立国語研究所は文部科学省所管の独立行政法人です。昭和23年の設立以来,国語の改善及び外国人に対する日本語教育の振興を目的とした研究事業を行ってきております。
近年,私どもは,日本語の科学的研究の基礎資料とするために,明治期から現代に至る日本語の大規模なデータベース(コーパス)KOTONOHAの開発を進めておりますが,平成18年度からは,その一部として,現代語の書き言葉を対象とする『現代日本語書き言葉均衡コーパス』の構築に着手しております。完成したデータベースは,研究者,教育関係者のみならず,一般の方々にも広く利用していただける形で公開する予定です。
本データベースにサンプルとして採録する文章は,1976年から2005年の間に刊行された刊行物の中から統計学的な方法で無作為に抽出したものです。表,図,写真等はサンプルに含まれません。
サンプルとしては,当該作品の意味上のまとまりを持った一部(章や節)を10,000字を上限として採用させていただきます。私どもの試算では,サンプルは平均で4,000字程度の長さになるものと予想しております。
また,本データベースは書き言葉の用例を検索することを主な目的として構築されており,通常の利用法においては,検索対象とする語の前後数十文字を出力するにとどまります。
対応はどうすればいいんでしょう?許可にしましたが・・・
拝啓時下ますます御清栄のこととお喜び申し上げます。
私ども国立国語研究所は文部科学省所管の独立行政法人です。昭和23年の設立以来,国語の改善及び外国人に対する日本語教育の振興を目的とした研究事業を行ってきております。
近年,私どもは,日本語の科学的研究の基礎資料とするために,明治期から現代に至る日本語の大規模なデータベース(コーパス)KOTONOHAの開発を進めておりますが,平成18年度からは,その一部として,現代語の書き言葉を対象とする『現代日本語書き言葉均衡コーパス』の構築に着手しております。完成したデータベースは,研究者,教育関係者のみならず,一般の方々にも広く利用していただける形で公開する予定です。
本データベースにサンプルとして採録する文章は,1976年から2005年の間に刊行された刊行物の中から統計学的な方法で無作為に抽出したものです。表,図,写真等はサンプルに含まれません。
サンプルとしては,当該作品の意味上のまとまりを持った一部(章や節)を10,000字を上限として採用させていただきます。私どもの試算では,サンプルは平均で4,000字程度の長さになるものと予想しております。
また,本データベースは書き言葉の用例を検索することを主な目的として構築されており,通常の利用法においては,検索対象とする語の前後数十文字を出力するにとどまります。
対応はどうすればいいんでしょう?許可にしましたが・・・
- Newer: マイケル・ジャクソン追悼
- Older: Flashのお遊びを見てください。
