前回からの続きです。 今回は文章の選定から配置までです。
16. 文章の収集
カレンダーの文章は、基本的にさかのぼって1年分の時事ブログのコメントと映像配信から集めてきます。
しかし、すべての記事と映像の文字起こしに目を通して…というのは、あまりに対象が膨大です。また、時事ネタや宗教学の解説など、ほとんどの発言はカレンダーの文章として使えません。
そのため、このカレンダー専用の文章収集システムを開発してあります。
このような単語表をもとに、カレンダーにふさわしい言葉が多く含まれている文章だけを、システムに集めさせます。
17. 文章の手選別とおおまかな抜粋
システムは、だいたい1年分で500ほどの文章を集めてきます。
ここからはひとつひとつ手作業で選別していき、採用した文章はおおまかな抜粋も行います。