초록 열기/닫기 버튼

本稿では、第2次教育課程の時期から2007年改定教育課程の時期に至るまで、約40年間の間に発行された高等学校の日本語教科書(全78册)をテキストコーパス化した結果とその活用方法について報告する。教科書コーパスは、高等学校の日本語教科書に収録された日本語テキストを、原則的に1文ごとに区切って改行したデータを作成したもので、入力行の先頭に付加情報として教育課程、教科書、単元、ページのタグが付与されており、テキストの検索及び分析等を効率的に行うことができる。なお、本稿では教科書コーパスの活用例として、まず、テキストエディタによる文字列の検索と置換などの処理方法、教科書収録語彙の形態素解析の実例を示した。次に、希望を表す助動詞「たい」と格助詞「が」「を」の共起関係、叙法副詞「せっかく」の構文的特徴、「なければならない」に代表される義務表現について分析した結果を示した。