Timee Product Advent Calendar を支える日本語の技術
この記事は Timee Product Advent Calendar 2024 の18日目の記事です。

こんにちは
またお会いしましたね。タイミーで働いている口藏(くちくら)です。今年の3月に入社し、6月からエンジニアリングマネージャーをしています。じつはそのかたわら、前職での経験を活かしてこのアドベントカレンダーの校正校閲チームをお手伝いしています。そこで、この記事ではその「校正校閲」についてお話ししようと思います。
この記事の想定読者は主にソフトウェアエンジニアですが、同時に文章を書く人全般(つまりあなた)をも想定しており、目的は「読者の文章力の向上」に置いています。ところが「読むだけでうまい文章が書けるようになる」ことを謳う文章は世に数多あるものの、実際には読者自身が手を動かさなければうまくはなりません。ですので、この記事の目的は正確には「あなたに手を動かさせること」にあります。
しかし待ってください。この記事は校正校閲に関するもののはずです。それがどうして読者の文章力向上や手を動かすことに関係するのでしょうか。校正校閲はあなたではなく、あなたの記事をチェックする人のためのものなのではないのでしょうか。校正担当者のみならず、あなたの文章力にまで影響してしまうという、なんとなくわかっているようでじつは得体のしれない「校正校閲」とはいったい何なのでしょうか。
校正校閲って何?
校正校閲とは「校正」と「校閲」という2つの作業を複合した名称です。厳密にはそれぞれ異なる作業なのですが、現代においてはしばしば同一の作業者によって行われるために、まとめて「校正校閲」と呼ばれています。以下、順番に説明します。
「校正」
「校正」という言葉の指す作業内容は、時代とともに変化してきました。
現代の執筆の多くはパソコンのエディタ上で行われ、編集もまた Adobe InDesign 等のレイアウトアプリケーション上で行われます。そうして編集までが終わったものを紙に出力し(初校、ゲラ)、それと著者による原稿を照らし合わせ、原稿が正しくレイアウトされているかどうかをチェックする作業が、現代における一般的な「校正」です。
それに加えて、上記の作業を行っている中で発見される誤字脱字などを確認することによって、原稿自体の正しさをチェックする作業も「校正」と呼んでいます。これは、著者の頭の中にある言葉が正しく入力されているか、著者の用語が一般的な用語に対して正しく使われているかなどをチェックする作業と捉えることができるでしょう。
また、かつて人々が石板や粘土板、竹簡、木簡、紙などに直接筆記していた時代には、手作業の筆写による複製が行われていました。しかしながら、人間の作業ですのでしばしば誤りもあります。そこで原本と複製とを見比べて正しく複製できているかどうかをチェックする作業が必要で、それがこの時代における校正でした。ただし、仏教経典の写経事業が行われていた神亀4年(西暦727年)の日本にはまだ「校正」という言葉はなく、「校生」と呼ばれた人々がチェック作業に携わっていたことだけがわかっています。
やがて活版印刷技術が発明され、機械的に複製が作られるようになりました。しかしそれでも「校正」の仕事はなくなりません。活版印刷では、原稿をもとに活字を並べていく「組版」という作業が行われます。しかし組版は手作業なので、やはりしばしば誤りがあります。そこで組版されたもの(枠)を使って紙に刷ったもの(初校、ゲラ)と原稿とを見比べて正しく組版されているかどうかをチェックする作業が必要で、それがこの時代における校正でした。ちなみに組版されたあとの活字が並んだ木枠のことを英語で galley と呼んでいたのが本邦に輸入され、galley を使った初校のことをその音からゲラと呼ぶようになったそうです。
時代による違いはあるものの、「校正」という言葉は一貫して「前作業の正しさを確認する作業」を指しています。
「校閲」
では「校閲」はどうでしょうか。一般的に校閲は「内容の正しさや読みやすさ、文意の明瞭さ、遵法性を確認する作業」「校正の内容を越えた作業」と説明されます。個人的にはより抽象化して「ふさわしさを確認する作業」と捉えています。実際の観点については後述しますが、ある文章(や図版)がそこに掲載されるにあたり、内容の正しさ・読みやすさ・文意の明瞭さ・遵法性などなどはそれぞれ程度の違いがあると思われるためです。たとえばスポーツ新聞には高い正確性は求められません。法律文や法令に関しては、読みやすさは二の次でしょう。密かに残した日記に対して遵法性を求めることもなかなかありません。
ということで以下この記事では、「校閲」という言葉は「ふさわしさを確認する作業」を指すものとして述べていきます。
ここまでで、校正は前作業の正しさを、校閲はふさわしさをそれぞれ確認する工程だということがわかりました。では、これらはいったい何のために行われているのでしょうか。
校正校閲の目的
校正校閲の作業目的は、著者が執筆をする目的と同じです。著者には「読者を感動させること」「読者に何らかの行動をとってもらうこと」「読者に何かを知ってもらうこと」「これを書いてお金をもらうこと」などの目的があり、著者はそれを果たすために文章を書いているはずです。それと全く同じ目的意識を校正担当者もまた持ち合わせており、「読者に感動してもらいたい」「読者にこれをしてもらいたい」「読者にこれを知ってもらいたい」「校正校閲をしてお金をもらいたい」と思うがために校正校閲の作業を行っています。そしてタイミーにおける校正校閲では、筆者は「読者に著者の主張や知見を正確に伝えること」を目的としています。
よくある勘違いとして「校正担当者は他人のあら探しがしたいから作業をしているんだ」というものや「間違いを見つけて笑っているに違いない」というものがありますが、これらは完全に間違いです。より目的に適う文章にするためにはどうすればいいのか考え、著者の意図について尋ねたり提案したりしながら、日々頭を悩ませているのが校正担当者です。校正担当者はあなたの敵ではなく、むしろ同じ目的を持って共同戦線を張る味方同士なのです。
エンジニアリングと校正校閲
これはとくにソフトウェアエンジニアへ説明するときに便利なので使う例え話なのですが、文章の校正校閲とコードレビューは非常によく似ています。みなさんは日頃コードを書き、より目的に沿ったコードにするためにレビューを依頼し、また反対に依頼を受けてはそのための指摘をしていると思います。その際のメンタルは「あら探しをして叩いてやろう」といったものではないはずです。また企業人としてコードを取り扱うにあたっては、より高い品質が求められますが、それもまた企業所属として記事を公開する際に求められる正確性・遵法性などに似ていますね。
そもそも文章とコードも似ています。コードの実行環境は、文章においては対象読者の頭の中と言えるでしょう。また、プログラミング言語のあるメソッドの挙動がバージョンにより変わる事象は、自然言語での言葉の意味の変化に対応します。エラーの際に意図しない結果が得られる(または意図せず何も得られない)こともありますが、それもまた文章と同じです。さらに文章が書かれる際には、一般的でない独自の造語や言い換えについてはその使用において説明が必要ですが、コード上でも組み込みや外部から読み込んだライブラリ内などに未定義のクラスやメソッド等は使用できませんね。こうして挙げるにつけ、両者はますます似ているように思えてなりません。
ここまでで校正校閲の内容や目的について知り、それがソフトウェアエンジニアの日頃の振る舞いと似通っていることについてもわかってきました。では、実際の校正校閲では何が行われているのでしょうか。
実際の校正校閲
ここで紹介するのは筆者のもので、あくまで一例です。ここに記載のないツールや観点を用いて作業を行っている方々や現場も数多くあるはずですので、前述までとは異なった特殊な内容としてお読みください。
校正校閲のツール
エディタの機能
「ツール」と銘打っておいて申し訳ないのですが、私自身はあまりツールを使用しているほうではありません。タイミーでは主にみなさん Notion や Google Docs を使用して執筆してくださるので、指摘や修正提案にはそれらの機能であるサジェストモードやコメントを利用しています。
主にサジェストモードでは校正を、コメントでは校閲を行うことが多いです。これは前者がより強い意思や根拠を持った指摘であり、後者が質問や確認であることを著者に示すためです。紙での校正校閲における赤鉛筆(校正)と鉛筆(校閲)の関係性に近いのではないかと想像しています(じつは筆者は紙の校正をやったことがないのです)。
また、近年のエディタは入力時に誤りを検知してアラートしてくれる機能を備えています。その多くはもっぱら英単語の綴りに関するものですが、Google Docs では「てにをは」の誤りなども部分的に検知してくれるようで、まだまだ完璧なものではありませんが、執筆時や校正時の助けにはなります。
言語の仕様がわかるもの:辞書
校正担当者の必須アイテムといえば辞書です。「紙の辞書ではよく引く言葉(見出し語)なら1手で、そうでなくとも2,3手で引けるようにするのが校正者というものだ」という話もあるぐらいに重要なものですが、なぜそんなに重要なのでしょうか。ここで辞書とは何かについても触れてみましょう。
辞書は、辞書編纂者によって作られています。その辞書編纂者は用例(言葉の使われ方)の採集を日常的に行っています。映画『舟を編む』にも登場したのでご存じの方も多かろうと思いますが、用例採集のための「採集カード」という道具があり、そこに採集対象の単語とその使われ方を記入するのです。そうやって書き溜められた「世の中での言葉の使われ方」から、辞書に掲載すべき言葉を選びます。選定基準は辞書の対象者や使い方によって様々かと思われます(じつは筆者は辞書の編纂をやったことがないのです)。
そうして選ばれた言葉について、用例や専門知識などによって語釈を書き(採集担当者と語釈の考案者は別であることもしばしばのようです)、全体の体裁などを整えつつ、長年の辞書編纂の中で生まれた新しい言葉や意味についても検討して調整し、印刷されてやっと世に送り出されるのが辞書です。要するに「ある時点で使われている言葉とその一般的な意味を集めた選定的スナップショット」が辞書なのです。
私たちソフトウェアエンジニアが辞書のように扱うものといえばマニュアルやガイドラインかと思われます。プログラミング言語は自然言語とは違い、一定の仕様が決められ、その変化は比較的ゆるやかです。それに対して自然言語は、誰かが仕様を決めるものではなく、ある集団の中で一般的に使われていればその使われ方がそのままその集団における言語仕様となる性質のものです。プログラミング言語は使用することと仕様にすることとが明確に分けられていますが、自然言語においてはその両者が一体となっています。ですから、マニュアルやガイドラインのように「誰かが決めてみんなが守れば概ね動作する」という環境を用意すること自体が不可能であり、代わりに実際の使われ方を採集して、より広く動作が期待できるであろう仕様をまとめたものを辞書という形で用意することしかできないのです。
すこし話が脇道にそれてしまいましたが、扱うものや作り方に差はあれど、辞書はマニュアルやガイドラインと同様に言葉の使い方を参照するためのものだということは共通しています。自然言語といううつろいやすく掴み取りにくい厄介者を取り扱う校正校閲という作業において、辞書が重要になるのはそのためです。
そんな辞書にはいくつか種類がありますが、ここではアドベントカレンダーの校正校閲において筆者が使用しているものを紹介していきます。
辞書アプリ:物書堂
参照:https://www.monokakido.jp/ja/
物書堂アプリは、いくつもの辞書を並列で引き比べることのできる iOS/iPad/MacOS アプリケーションです。アプリ内で主に使用している辞書は以下です。
これらの中でも『精選版 日本国語大辞典』と『用字用語辞典』にはとくにお世話になっています。前者は古代・中世からの日本語使用についても検討されて用例が掲載されているために幅広い判断ができること、後者は後述する文化庁の調査結果を一覧化してくれているのでとくに近年の使われ方に絞った判断ができることが有用です。
物書堂アプリにはペーストボード内の単語を自動的に検索してくれる機能もあるため、気になった部分を選択してコピーする操作のみで引くこともでき便利です。また Mac と同一アカウントでログインしている iPad などに物書堂をインストールしておくことで、ペーストボードの共有機能を使い、Mac 側でコピーした単語を iPad 側でシームレスに検索することも可能です。筆者はこの体験があまりに良すぎたために、このアプリが手放せなくなりました。
紙の辞書
先に辞書アプリを挙げたのですが、紙の辞書(とくに未だ電子化されていないもの)も有用です。筆者の辞書利用は電子が主なのですが、本職の校正校閲担当部門においては、各辞書の特徴を把握し各時代での意味の変遷を把握するためにいくつもの紙の辞書を引き比べる必要があるため、今後電子化されることがおそらくないであろう過去の版のものを使い続けているようです(たとえば『広辞苑』『大辞林』『新明解国語辞典』を担当した伝説的な校正者である境田稔信氏は、辞書を7000冊以上所有していることでも有名です)。
ここでは私がとくに気に入っている『てにをは辞典』(三省堂)を紹介します。これはいわゆる日本語のコロケーション(連語)を文学作品の中から採集したもので、単語を採集した一般的な国語辞典とは異なります。採集した連語をさらに助詞(てにをは)ごとにグルーピングしているため、ある言葉(名詞)で引くとその言葉とどんな助詞や単語が結びつけて使用されるのかが一覧できるようになっています。
たとえば「彩り(いろどり)」の項には、「〜が豊かになる」「〜を重ねる」「〜を着こなす」「〜を見出す」「〜鮮やかな」「〜美しい」「〜華やかな」などが掲載されています。実際の利用シーンにおいては、このような用例を見ながら提案すべき言い換えについて考えるということが多いです。
ちなみに同様の使い方ができるものとして、Webサービスの『少納言』や『中納言』(いずれも国立国語研究所による)などのコーパスもあります。
参照:https://clrd.ninjal.ac.jp/bccwj/
これらはグルーピングなどを経ていない生の文に触れることができるものですので、文中の前後関係などからより詳細な使い方を検討しなければならない場合などに合わせて利用できそうです。
辞書の話は始めるとキリがないため、このあたりにしておきます。
近年の言語使用を知るためのもの:国語に関する世論調査
参照:https://www.bunka.go.jp/tokei_hakusho_shuppan/tokeichosa/kokugo_yoronchosa/index.html
プログラミング言語がバージョンを重ねて変化していくように、自然言語も変化していきます。また前述の通り、自然言語(とくに日本語)を規定するものはその実際の使用です。そういった事情から、日本語の現況を把握するためには実際の使用状況を把握しなければならず、辞書の編纂にあたっては用例の採集を行っているということはこれもまた前述した通りです。しかし辞書編纂は一般的に数年がかりの作業であることが多いため、新版が出るまでの間の状況については別の手段で把握するしかありません。
そのうちのひとつが文化庁が毎年度行う「国語に関する世論調査」です。これは日本全国の16歳以上を地域・都市規模に分けて無作為に抽出した母集団を対象としたアンケート調査で、その調査そのものに関する報告書と、結果だけをまとめた概要が公開されています。
扱う内容は幅広く、国語に対する関心や英語への考え、読書や活字への向き合い方、表記についてなどありますが、その中でも筆者は(そしておそらくは他の校正担当者も)言葉遣いに関する調査結果に着目しています。たとえば令和5年度の概要のp.43(PDF版の46枚目)では「悲喜こもごも」が取り上げられています。
参照:https://www.bunka.go.jp/tokei_hakusho_shuppan/tokeichosa/kokugo_yoronchosa/pdf/94116401_01.pdf
「悲喜こもごも」という言葉は、本来は「悲しみと喜びを次々に味わうこと」を意味するのですが、アンケート結果では「悲しむ人と喜ぶ人が様々にいること」がおよそ6ポイント上回っています。だからといって意味が完全に変わったものとして捉えるには時期尚早ですが、このような結果をもとに想定している読者によりふさわしいかどうかを検討したり、別の言い回しを提案したりするための判断材料になってくれます。
形式を揃えるためのもの:ハンドブック
より多くの人が違和感なく読めるような文章を執筆するにあたり、言葉の意味は辞書などから知ることができますが、こと表記に関しては辞書の領分の外にあります。たとえば「ベートーベン」と「ベートーヴェン」とでは、どちらがより違和感なく受け入れられるのでしょうか。
多くは媒体によって表記などの規則が決められているのですが、個別のルールを決めるにあたって参考にされている、いわばデファクトスタンダードのようなものが存在します。それが各種「ハンドブック」です。ここではとくに時事通信出版局から出ている『用字用語ブック』、NHK放送文化研究所から出ている『NHKことばのハンドブック』を紹介します。
これらの書籍にはそれぞれの媒体(時事ドットコムなどのニュース記事やNHKの放送番組)での表記規則がまとめられています。たとえば『用字用語ブック』では使用する漢字やひらがな・カタカナ、句読点の打ち方、専門用語、差別語・不快語、人名や数字や外国名の表記などが扱われています。また『NHKことばのハンドブック』は、間違いやすい用語や揺れやすい表記の説明に多くの紙幅が割かれているのが特徴です。
筆者は所有していないのですが、一般社団法人共同通信社から出ている『記者ハンドブック』などもありますので、実際の媒体の求めるものを購入すると良いでしょう。このアドベントカレンダーにおける表記の厳密なルールは用意されていないので、筆者は参考程度に照会しています。
使用を模索中:LLM
近年の流行物なのでLLMにも触れておきますが、じつのところまだうまく活用できていません。全体の誤字脱字チェックや言い回しの確認に使用できなくはない印象ですが、ヌケモレもままあるために、今の文量であれば最初から自分で見るほうが早いと判断しています。今後作業量が増えて人手が足らず、かつある程度の妥協が可能な場合に使用が検討できるのではないかと考えていますが、あまりそういう事態について現実感がありません。ただ、単純に筆者が適切なプロンプトを用意できていないだけである可能性もあるので、LLM使用の模索自体は継続していくつもりです。
上記は筆者固有の状況ですが、あまりDXが進んでいないことがわかりますね。とはいえ世の中には文賢(https://rider-store.jp/bun-ken/)などのチェックツールも数多くありますので、それらの利用が進んだ際にはまた、執筆時のLLM利用についてなどとも併せて別の機会にてお知らせしようと思います。
道具については以上です。執筆においても有用なものばかりですので、もっぱら書くこと専門のみなさんも利用を検討してみてはいかがでしょうか。
校正校閲の観点
校正では主に以下の具体的な観点をもとにチェックを行っています。
- 誤字・脱字・余計な文字の混入がないか
- 用語の誤り(一般語、専門用語など)がないか
- 英数字や約物(記号類)の半角全角が統一されているか
- 一般的でない常用漢字と人名用漢字の使用がないか
- てにをは(助詞)の正しさ
- 助数詞の正しさ
- 接続詞の正しさ
- 敬語・謙譲語の正しさ
- 商品名などの名称の正しさ
- 外来語のカタカナ表記の正しさ
- 媒体の規則に則っているか
校閲では主に以下を確認しています。
- 想定読者が設定されているかどうか
- 記載内容の正しさ
- タイトルのふさわしさ
- 文意の明瞭さ
- 論理的につながっているか
- 一文が長すぎないか
- 冗長でないか
- 主述がねじれていないか
- 一般的でない造語が説明なしに使われていないか
- 理由のない難読語がないか
- 係り受けが意図通りか
- 文体が一貫しているか
- 比喩表現が的外れでないか
- 差別的な内容や言い回しがないか
- センシティブな内容や言い回しがないか
- 社外秘が含まれていないか
- 法律や法令や規約に違反していないか
そのほか媒体などに応じてここにない観点についても追加しながら、臨機応変に作業しています。今回のアドベントカレンダーに関しても同様です。
チェック観点のもたらす効果
これらの観点は、校正校閲のみで有用なものではありません。じつを言うとこれらのうち多くは、より良い文章の書き方についての書籍の中でも頻繁に取り上げられているものです。つまりこれらを意識して実践することがそのまま、良い文章制作につながるとされているのです。
エンジニアリングにおける校正校閲との類例は、テストです。上記の校正校閲における観点は、テストにおける検証項目と捉えて問題ないでしょう。検証をその専門部隊が実施する点では、QAチームは校正校閲チームと言い換えられるでしょう。エンジニアリングに従事するみなさんは日常的にコードを書いていると思いますが、その際にテストコードを書くことの有用性についてもこれまでに幾度となく言及されているため、当然にご存じかと思います。また、企業所属で求められるテストコード実装の振る舞いが、プライベートでの開発においても良い影響を与えていることでしょう。
それと全く同じことが執筆にも当てはまります。冒頭に提起した「校正校閲がどうして各人の執筆にまで影響するのか」という問いの答えがこれです。日常的に上記の観点を意識した作文と自己チェック(読み返し)を実践することが、自ずとチェックに通るような作文の実践にもつながり、より読みやすい文章を初めから書くための能力(作文力)の向上にもつながるのです。
スキルの磨き方の一例
校正校閲とテストとの共通点はそれだけでなく、テストに関わる能力の向上が実装能力の向上に相互に寄与するのと同様に、校正校閲スキルの向上が文章力の向上にも相互に寄与する点も似ています。そして校正校閲スキル向上の手段は文章力向上の手段とほぼ同じです。記事冒頭において「文章力の向上には手を動かす必要がある」と書きましたが、校正校閲に関してもまた同様です。作文しましょう!
……おしまい、としてしまっては味気ないので、以下では正攻法である文章制作については触れず、「校正校閲実践のための翻訳」について紹介します。
他言語から日本語への翻訳
意外に思われるかもしれませんが、日本語への翻訳作業には高い日本語力も問われます。たとえば英語からの翻訳においては正確に読み取るための英語力も当然に必要なのですが、原語でのニュアンスなどを含めて日本語で適切に表現するための日本語力も、英語力と同程度またはそれ以上に必要になってくるのです。
たとえば ”He felt a surge of exhilaration as he crossed the finish line.” という文を訳そうとするとき、”a surge of exhilaration” を単に「高揚感」としてしまうのでは、原語の持つ「突発的で強烈な」というニュアンスが失われてしまいます。かといって「それは急激で強烈な〜」などと言葉を重ねて二文に分けてしまうのでは、元の文の持つ全体での位置づけや効果を失ってしまうかもしれません。適切な言い回しを考えて一文に収めようとするとき、翻訳者の日本語力(語彙力)が試されます。
さらにもう一例挙げると、慣用句についても同様のことが言えます。英語には “It’s raining cats and dogs." という慣用句がありますが、これも単に「土砂降りの雨が降っている」とするのでは原文が持つ面白みを失ってしまいます。ではそれをどうやって表現すれば良いのか考えるとき、日本語力(語彙力やレトリック力)が試されます。
さて、翻訳を実践するにおいてより望ましいのは、何らかの製品にするための翻訳作業を行い、複数人の手になる校正校閲を経ることです。とはいえ未経験での実務翻訳作業はなかなか転がっていないというのもまた事実。筆者は偶然にも、エンジニアリングとは別の文脈からいくつかの翻訳の機会(たとえばこれ)を得ることができましたが、それらはかなり特異なルートでした。そこでソフトウェアエンジニア一般的には、以下のようなチャンスを狙っていくのが良いかと思います。
- 海外原著の技術書の翻訳
- くだけた言い回しやサブカル文化からのジョークなどが頻出するので、とくにおすすめです!
- 言語やフレームワークのマニュアル等の翻訳
- オフショアから英語で納品された仕様書・設計書などの翻訳
おわりに
校正校閲の実際を知ってみて、いかがでしたでしょうか。案外簡単に始められるんだなと思っていただけていれば筆者としては嬉しいところです。もしそう思っていただけたのなら、まずはご自身の文章について客観視しながら、先述した観点をセルフチェックすることで品質を向上させることから始めていただくのが良いのではないかと思います。筆者個人としてはエンジニアのさらなる情報発信を、そして世にあふれる文章全体の品質向上を願ってやみません。
またこの記事を書くにあたって自分の作業環境について振り返ることができ、本業ではないにしろAI利用や静的解析の導入などがほぼ進められていないことに思い当たったので、来年のこの場ではその点についても改めて成果発表できたらと思いました。ここまでお読みいただきありがとうございました。