2025-12-08

どうしてあなたは「AIに裏切られた」と感じるのか

この記事は、Timee Product Advent Calendar 2025 シリーズ3の8日目の記事です。

こんにちは。タイミーでエンジニアリング・マネージャーをしている口藏です。最近は古文書解読検定にハマっています。

さて、猫も杓子もAIという昨今ですね。私も仕事にプライベートにとAIにべったりで、たとえばかつては「掃除機コードレス価格」なんて Google で検索していたのが、「コードレス掃除機で3万円ぐらいまでのおすすめは？最新機種の情報を取得してまとめて」なんて ChatGPT に頼んでいる毎日です。

そんなAI利用ですが、使っていると急にAIの人格が豹変したように感じられた経験はありませんか？もしくは、長めのプロンプトを渡したあとの方向修正で、当初の意図から大きくズレた回答が返ってくるようになったり、そもそも意図しない結果が出力されたり。

この記事ではそういった「AIによる期待の裏切り」について、AI側の内部処理の特性や人間側の性質に基づきつつ、この現象のメカニズムを解明していきます（そうできたらいいな）。

何を「裏切り」と感じるか

AIを使っていて個人的に「いま裏切られてるなー」と感じる場面は以下の3つです。

内容・方向性の不一致：依頼した方向性が守られず、出力が意図しない方向へ進むこと。
- 「そんなこと頼んでないのになー」と感じる場合。
トーンやスタイルの急変：それまで維持されていた会話のトーンや出力のスタイルが、予告無く突然変わってしまうこと。
- 「いきなり口調変わったけど、誰？」と感じる場合。
記憶の限界と文脈の破綻：長い会話の中で、過去の指示や文脈が無視され、応答に一貫性がなくなること。
- 「それ少し前に教えたじゃん。なんで忘れてるの？」と感じる場合。
ハルシネーション：事実と異なる、または存在しない内容を事実として出力すること。
- 「嘘をつかれている」と感じる場合。

AIはなぜ「裏切ってしまう」のか

この「裏切り」は、AI側・ユーザー側両方の性質が関連して発生しています。まずはAI側の性質を見ていきましょう。

Temperature とランダムサンプリング

生成AIは、基本的に分布仮説（ある単語の意味は、それが登場する前後の文脈によって形成される、という仮説）に基づいた学習を行っており、確率的に次のトークンを予測することで文章を生成しています。これはあくまで確率的なものであり、完全な決定論的生成（この単語の後には必ずこの単語が来る、といったような文章生成）ではありません。そこで生成AI内部では、Temperature などのパラメータによってトークンのランダムサンプリングの度合いが調整され、結果としてそれが出力されるテキストのトーンやスタイルに影響しています。トーンやスタイルに一貫性が崩れるのは、この無作為性による場合があります。

コンテキストウィンドウとその限界

Transformer モデルでは、入力として受け取れるトークン列の最大長に制限があります。これを「コンテキストウィンドウ」と呼びます。たとえば、GPT-3 のコンテキストウィンドウのサイズは、2,048トークンでした。ひとつの会話が長大になったり、プロンプトの文字数が非常に長かったりで、このコンテキストウィンドウのサイズを超過してしまうと、生成AIは古い情報を参照できなくなり、会話中での一貫性を失ったり、文脈が途切れたりしてしまいます。

指示の優先順位とシステムプロンプトとの衝突

ユーザーからの指示（ユーザープロンプト）と、SaaS 提供者側の設定した、AIの基本的な振る舞いを規定するためのシステムプロンプトとの間で矛盾が発生した場合、意図しない出力がされてしまいます。

たとえば OpenAI 社の ChatGPT は、ユーザープロンプトで求められている出力結果が利用規約に抵触するような指示だった場合には、「規約違反である」旨を最優先で出力します。また、出力結果などに性的な内容や倫理規定に反する内容、犯罪教唆にあたる内容が含まれる場合も、AI側の判断により出力が抑制・または拒否されます。この場合にはクライアントアプリケーション側でのフェイルプルーフも働いており、AIがセーフであると判断した出力結果を、出力結果の表示側が遮断することもあります。

それ以外にも、Web検索後の結果をまとめるタスクや、画像処理が含まれるタスクなどにおいては、結果伝達の正確さが最も重視され、その他の命令（たとえば口調の一貫性やコンテキストの維持）が軽視されます。

情報の鮮度

生成AIは大規模な事前学習によって汎用的な対応能力を実現しています。しかし、その訓練に使われた情報は、準備の手間もまた大規模であるために、当然ながら最新の情報であるとは限りません。これは現在の最新モデルである GPT 5.1 についても、どうやら「2024年の後半あたり」が最も新しい情報であるようです（GPT本人の回答に基づく）。これよりも新しい情報の取得は、つどWeb検索を指示する必要があります。

ハルシネーション

生成AIは、上記の「鮮度の古さ」や、訓練時の振る舞いとして「無回答よりは何かしら回答するほうがスコアが良い」とされる圧力によって、時として無自覚に事実でない内容を出力します。これはそれを出力した生成AI自身にとっても無自覚なものであるらしく、「嘘をついた」と感じていないので、自覚的に嘘を修正することもできないようです。ユーザーからいちいち指摘されなければならないので、私たちユーザー側からしても出力内容を容易に鵜呑みにできない原因になっています。

また、上述した通り、生成AIは分布仮説に基づいた文章生成を行っており、一貫した論理に基づいた文章生成は行っていません。つまり、「嘘か本当か」であったり「前後の文が論理的につながっているか」であったりと、論理的な流れを意識した文章生成を苦手としています。これにより、ユーザーにとって支離滅裂な文章を生成してしまうことがあります。

人間はなぜ「裏切られてしまう」のか

続けて、人間側の性質を見ていきましょう。

過度の人格化

人間は、生成AIとの対話において、AIを人格化（アントロポーモルフィズム）してしまいます。とくにAIの性能が向上し、回答の質や使用事前の期待感が高まるほど、この傾向は強まります。

信頼の構築と崩壊

人格化の結果として、人間とAIの間に一方的な信頼関係が構築されます。しかし、AIの文脈の継続しない出力や振る舞いの変化などによって、人格の一貫性を失うと、それが信頼関係の崩壊につながります。この信頼の崩壊の結果として、「AI不信」に陥ってしまう場合もあるようです。

生成AIとの上手な付き合い方

最後に上記を踏まえ、「裏切り」を防ぐような生成AIとの付き合い方を提示してみます。

AIはあくまでツールであるという割り切りと、儀式化

大前提として、生成AIはあくまでツールです。人格ではありません。テキストは確率的に出力されたものであり、ある人格から一定の論理を持って生成されたものではありません。

この認識を持ち続け、過度な人格化を行わないために、会話冒頭において「私はこれをツールとして使用します」「Devin 起動」など、終了時にも「会話プロセス終了」などと入力し、同時に自分に言い聞かせることが有効です。また、自身で「過度に人格化しているかもしれない」と感じた際には、普段使用している生成AIに対して「これから私がする主張をすべて論理的に否定してください」と前置いたうえで、「あなたはひとつの人格である」などと主張してみるのも良いでしょう（ボコボコに反論されてぐうの音も出ない状態にされるのがベストです）。

コンテキストウィンドウを意識した会話

AIの記憶の限界を意識した会話を行いましょう。会話中に新たに重要なコンテキストを導入する際には、過去の重要な指示を再確認してコンテキストの中での鮮度を上げさせたり、ChatGPTの「メモリー」のような永続化されたコンテキストとして保存したり、長すぎる会話を意図的に区切ってから新たに開始したりしましょう。

鵜呑みにしないこと

生成AIは無自覚に嘘をつくものだとして、結果を鵜呑みにしないことです。私はこれで存在しないはずの書籍を探し回り、時間をかなり無駄にしました。存在していてくれればどんなに良かったことか。いっそ生成AI側で責任もって書いてくれ。

さいごに

生成AIとの付き合い方は、今後の進歩によって大きく変わってきます。とはいえ、基本的な性質に大きな変化はないでしょう。また、それを使う人間の側の性質は、今後も変わりません。両者の限界を意識して、これからも楽しい生成AIライフを過ごしたいものですね。

私が所属している株式会社タイミーでは、AI利活用を組織として日々推進しています。「どんな使い方してるの？」「自分はこんな裏切りにあった！」など、ぜひお気軽にお話ししましょう。

プロダクト採用サイトTOP

カジュアル面談申込はこちら

2025-11-12

読書メモ：AIガバナンス入門（ハヤカワ新書）

もちろん、企業だけでなく国や自治体などにとっても、AIガバナンスは「自分事」であり続ける。しかし、そのあるべき姿は、伝統的なトップダウン型のガバナンスとは様相を異にするだろう。なぜなら、極めて複雑で変化の早いAIガバナンスの世界では、政府が事細かに「To Doリスト」や「禁止リスト」を作成することはできないからだ。

ーーP.17

感想

AI利用におけるリスク、その具体例、リスク管理のための取り組み（ガバナンス）、その一般的な内容や手法、その具体例（世界／日本）、そして未来……について、「AIガバナンス」を軸に幅広く知識を得ることができる内容だった。

ChatGPT や claude、Gemini などの生成AIの利用が公私ともに増えてきたこのごろ、とくに公である職場において、どのようにリスクを考えて対処すべきなのか、今現在考えられている指針や限界を知ることができ、良い読書になった。

今後ISOを読んでいくにあたって、そこに含まれているだろう内容についても俯瞰的に知ることができ、とても助かった。

次に読んでいる本

宗教認知科学(CSR)ー認知・心理・進化の視点から宗教を読み解く (ワードマップ)

新曜社

Amazon

2025-10-23

読書メモ：ラテン語とギリシア語（ちくま学芸文庫）

まずギリシア語のもつ単音を，母音と子音に分けるわけだが，現在の言語学も使用しているこの２つの用語と分類は，古代ギリシア人の着想によるものである。

ーーP.58-59

感想

ラテン語とギリシア語、古代西欧世界を代表する二大古代言語を並立し、その歴史や特徴などを比較しながら語る内容。もとは99年三省堂から出版の書籍で、文庫化されたものが本書。

ギリシャ文字やローマンアルファベットの成り立ち、「ギリシア」という言葉の由来、発音、文法的性、格変化、アスペクト、ムード、テンスなどの文法的要素、韻律、固有名詞まで幅広く扱う。

網羅性のある内容なので、自分の興味のある部分だけ読んでも問題ない。

次に読んでいる本

カードゲームで本当に強くなる考え方 (ちくまプリマー新書)

作者:茂里憲之
筑摩書房

Amazon

2025-10-08

読書メモ：ゆる古代ギリシア哲学入門クセつよ逸話で学ぶ31人（中公新書ラクレ）

『列伝』でのアナクシマンドロスの逸話はたった一つ。あるとき彼が歌をうたっていると子どもたちが笑いました。それに気づいたアナクシマンドロスは「それでは、この子供たちのために、もっと上手に歌わねばならないね」といったそうです（『列伝』第二巻二）。

（中略）

アリストテレスに子どもと一緒に遊ぼうという気はさらさらありませんが、アナクシマンドロスはどうでしょう。子どもたちが楽しめるよう、もっと上手に歌おうなんて言っているではないですか。ガラガラを褒めるアリストテレスとは大違いです。この正反対の態度は、両者の哲学の違いから生じていると私は睨んでいます。

ーーP.30-31

感想

古代ギリシア世界の哲学者について、その今に伝わる逸話をベースに哲学的思想の特徴を浮き彫りにしようという内容。

逸話は基本的にディオゲネス・ラエルティオスの『ギリシア哲学者列伝』からのもので、詳しく知らずにそれだけを見るとあまり思想を反映したものには思えないものもあるのだけど、著者の解説を読むと思想を伝えるために残されたものだとしか思えなくなるのが面白い。

いわゆる「ソフィスト」と哲学者の違いや共通点などについても知ることができる本。

次に読んでいる本

ラテン語とギリシア語 (ちくま学芸文庫カ-62-1)

作者:風間　喜代三
筑摩書房

Amazon

2025-09-29

第2回恐竜学検定中級を受けました

www.kentei-uketsuke.com

恐竜学検定とは、恐竜学検定実行委員会が運営する恐竜やその同時代の生物、恐竜に関する地質学の歴史などについての知識を問う検定です。去年第1回が始まり、今年は第2回目でした。9月28日日曜日に行われた第2回恐竜学検定中級について、勉強法、出題傾向、感想などを書いていきます。第3回を受ける人の参考になればと思っています。

勉強法

先にまとめておくと、私がやったのは以下です。

公式ガイドブックを通して知らない部分を浮き彫りにする
公式ガイドブックの「要チェック恐竜リスト」に載っている生物を図鑑でチェックしておく
図鑑を網羅的に読む
受検の直前に、図鑑のコラムページやコラム欄をもう一度読む

まだ第2回目なので、過去には1回しか実施されておらず、確立された勉強法は存在しません。出題範囲は学研の図鑑LIVE『恐竜新版』全体ですが、情報の起伏が十分でないので、これだけではどれが出てどれが出ないのかを意識した学習ができません。

恐竜新版 (学研の図鑑LIVE(ライブ))

作者:真鍋真
Gakken

Amazon

とにかく全部覚えることができる人ならこれだけで大丈夫ですが、そうでない人がほとんどでしょう。私は以下を追加購入しました。

恐竜学検定公式ガイドブック初級・中級

Gakken

Amazon

第1回を受検していないので正確なところは不明ですが、このガイドブックが第1回の過去問を含むものになっているようです。内容が前半・後半で初級・中級とに分かれているので、初級の知識の上に中級の知識を組み立てて覚えていくのが容易でした。

とはいえ一般的な検定の問題集とも異なり、覚えることよりは楽しんで読むことを意識した作りになっているため、暗記用のチェックボックスはありませんし、マークシートで消える赤文字印刷なども施されていません。おそらく主な受検者層として小中学生が意識されているため、児童書のような装丁・印刷になっています。

私はこれを通しで何度も繰り返し、内容を覚えました。チェックボックスの代わりに余白にペンを入れれば間違えた問題も記録しておけます。

「要チェック恐竜リスト」も重要でした。これは図鑑に収録されている恐竜などの中から初級・中級ごとに出題されやすい（あるいは第1回で出題された）恐竜などを選抜した一覧表です。まずこれを優先的に覚えることができるので、図鑑に戻って網羅的に覚える際にも、上述の「情報の起伏」を感じながら学ぶことができました。図鑑に書き込んだりシールを貼ったりしてもよさそうです。

また、図鑑にしか載っていない情報のうち、見逃してはいけないのがコラムです。各生物のページにあるコラム欄もそうですし、見開きを使った特集コラムからも出題されます。これらは図鑑に目を通すときはもちろん、受検時間直前を利用したおさらいで読んでおくこともおすすめです。

出題傾向

今回の全100問の問題を、以下に分類してみました。

ガイドブックからそのまま出題（初級）：1
ガイドブックからそのまま出題（中級）：44
ガイドブックからやや変えて出題：15
新しい問題だが「要チェック恐竜リスト」からの出題：24
新しい問題で「要チェック恐竜リスト」外からの出題：8
まったく新しい問題：8

ガイドブック範囲外の出題（下から2つの合計）は16問でした。100問中70問正解が合格ラインなので、ガイドブックの内容が正しく答えられれば合格できる設計になっています。親切ですね。

ただし過去問だけをそのまま覚えていて回答できるのは、上から3つまでの合計の60問のみ。合格ラインまで残り10問のギャップを埋めるためには、「要チェック恐竜リスト」にある恐竜についても学んでおく必要があります。ここをおさえて80点ラインを安定して得点できるようにしておけば、まず合格できるでしょう。

もちろん満点を目指すのであれば図鑑全体を覚える必要があるのですが、そのためのステップとしても、まずは過去問、次に「要チェック恐竜リスト」、次にコラム、次に図鑑全体という順序でやっていくのが、「ひとまず合格ラインには来れた」という安心感も得られますしおすすめです。

第1回に引き続いて、恐竜関係以外の教養知識も活かせました。名前の意味を問う問題はラテン語や中国語の知識から類推できますし、かんたんな地理や理科の問題も出題されます。「これも恐竜博士になるための勉強なんだ」と思えば、きっと学校の授業も輝いて見えることでしょう。

感想

私はだいぶ大人ですが、受検してみてかなり楽しめました。まだ子どもが3歳ということもあり、一緒に受検するということはできなかったのですが、将来恐竜に興味を持ってもらえたときには、「やってみる？かっこいい合格証がもらえるよ」などと口説いてみようと思います。

最後に、私の自己採点結果は89/100点でした。せっかくなので満点取りたかったものの、育児の合間にできた貴重な夜時間に、眠い目をこすって子どもの図鑑を借りてやるにはやや無理があった感じです。学習用のアプリが出ればかなり環境が変わってくるので、恐竜学検定実行委員会さんはぜひご検討ください（アンケートにも書かせていただきました）。

ではでは。

2025-09-29

頭部装飾における視認性の工夫とその要因

1. 序論

人間は頭部をもっとも象徴的な部位として意識し、そこに「完成」を求める傾向を持つ。

古今東西において装飾行為とは、単なる美的欲求ではなく、社会的・象徴的機能を持つ行為である。たとえば、Stephen Davies は『The Aesthetics of Adornments』（2014年）において、古代ロシアのスンギル（Sungir）遺跡の埋葬例を引き、装飾品が「社会的地位（social standing）」を象徴する意義を持っていたと論じている。

Personal adornments are neither trivial nor meaningless … What did the grave ornaments at Sungir signify? Social standing, of course.

（筆者訳：個人的な装飾は取るに足らないものでも無意味なものでもない…。スンギル遺跡の墳墓装飾の意味するものは？当然、社会的地位である。）

Stephen Davies, The Aesthetics of Adornments, in Aesthetics of Everyday Life: East and West 124–132.

彼はさらに、装飾が美的強調（aesthetic enhancement）を目指すものである一方で、それだけにとどまらず、社会的役割や権威を示す機能を適えるものであるとしている。

Adornments aim at aesthetic enhancement. … The General’s braid is primarily a marker of rank.

Stephen Davies, The Aesthetics of Adornments, in Aesthetics of Everyday Life: East and West 127.

髪型や冠、帽子、飾りは単なる装飾を超えて、地位や役割、神聖性を表現する手段となってきた。Glăveanu によれば、装飾は「識別・定位」や「注意誘導（視線誘導）」などの機能を持つと考えられており、視認性や注目誘導という役割を担う可能性がある。

Ornaments help us to identify and locate, tell or communicate, remind and organise our action, they guide our attention, express and individualise …

Vlad Petre Glăveanu, “The function of ornaments: A cultural psychological exploration,” *Culture & Psychology*, 20(1):82-101 (2014).

このような認識のもと、頭部装飾には「目立つ」「識別される」といった視認性の工夫が不可欠と考えられる。

本稿では、頭部装飾における視認性の工夫を四つに整理し、さらにその背景にある要因を検討する。

2. 視認性のための工夫

第一に「色」である。彩度の高い赤や青、希少な紫、輝かしい金色などは、強いコントラストによって視線を集める。とりわけ紫や金は、資源的な希少性とも相まって、社会的地位の高さを一目で示す役割を果たした。以下に各地・各文化での例を示す。

第二に「高さ」。冠や兜、羽根飾りは、頭部を物理的に拡張し、群衆の中で際立たせる。遠目からも識別可能な「垂直方向への強調」は、王や指導者、あるいは戦士の権威を示すために多用された。

第三に「発光・反射」である。金属の光沢や宝石の輝き、あるいは金箔などの反射は、光を利用して視線を誘導する仕組みである。光の方向によってきらめく装飾は、静止していても動きを想起させ、印象を強める。

第四に「動き」。羽根や布の飾り紐が風に揺れることで、周囲の注目を自然に集める。動きは人間の視覚において強い刺激となるため、小規模な揺れでも十分な効果を持つ。

3. 影響要因

これらの工夫を支えたのは、複数の要因である。

第一に「素材入手難度」。紫根や貝紫といった希少な染料、金属や宝石といった貴重資源の使用は、単なる美的効果を超え、「希少性そのもの」を示す記号となった。

第二に「社会制度」。冠位十二階のような位階制、中世ヨーロッパの身分差を示す衣装規定など、制度的に定められた色彩・装飾は、視認性を通じて社会的秩序を再生産する機能を担った。

第三に「文化象徴性」。黄金は神聖、赤は生命、青は天空といった象徴は、単なる物理的視認性以上に意味を付与する。頭部装飾は「見える」だけでなく、「意味を帯びて見える」存在であった。

第四に「物理的実用性」。戦場での敵味方識別や、儀式での見栄えといった実際的な要請が、装飾の工夫を後押しした。

4. 特例事例：宗教画の光背

宗教画に描かれる光背（ハロー）は、頭部装飾の延長にある特殊な表現である。黄金や放射線で描かれる円環は、聖性を可視化し、群像画の中で聖人を即時に識別させる。ヴェロッキオの『The Baptism of Christ』、ボッティチェッリ『Madonna della Loggia』、ポール・ドラロシュ『The Young Martyr』などの宗教画のほか、ドラガネット・ロセッティ『Venus Verticordia』に見えるような女神の聖性を示すものとしての使用例もある。

また金箔やテンペラ、後には油彩による技法は、実際に光を反射し、絵画の前に立つ人間に神聖な輝きを実感させる効果を持った。

この事例は、視認性が「社会的地位」から「宗教的聖性」へと拡張された例である。

5. 補遺：現代文化における再解釈

現代のサブカルチャー、特にゲームやアニメにおいては、光背は新たな演出要素として再解釈されている。

回転する円環、発光や脈動する光、粒子化による分解と再構築など、動的な表現は従来の静的なハローから大きく逸脱している。

ここでは神聖性よりも、むしろキャラクター固有の個性を示すことが重視される。光背は「特別な存在であること」を強調する装置として機能し、現代的な視認性の工夫の一形態といえる。

6. 結論

頭部装飾における視認性は、「色」「高さ」「発光・反射」「動き」という四つの要素に整理できる。これらは素材の希少性、制度的規制、文化的象徴、そして実用性といった複数の要因に支えられてきた。

宗教画の光背、さらに現代サブカルチャーにおける動的ハローの表現を加えることで、人間は古代から現代に至るまで、頭部を「際立たせる」ために工夫を重ね続けてきたことがわかる。

頭部装飾は、単なる美の追求ではなく、また頭部に「完成」を求めた結果というだけでもなく、「他者にどう見えるか」「いかにして特別であることを示すか」という人類普遍の問いに対する一つの解答であったのである。

2025-09-05

読書メモ：ゼロから12ヵ国語マスターした私の最強の外国語習得法（SB新書）

具体的に言うと、単語を覚えるときは、日本語訳よりも、その単語で画像検索して表示されるイメージで覚えるようにしています。
（中略）
すると、まとまった文章を聴いたときに、日本語訳よりも先にイメージが思い浮かぶようになります。イメージ的な理解は言語的な理解よりも早いため、単語をいちいち日本語に置き換えるよりも素早く理解することができます。
ーーP.194-195

感想

言語系配信者 Kazu Language さんの著書。12か国語（現在では14か国語？）で会話できるようになったその方法が語られている。

日常会話に目的を絞り、とにかく早くネイティブと話せるようになるために著者によって最適化された手法が公開されているので、同じ方法をなぞれば最短距離で会話まで臨めそうに感じた。まず第1ステップとしてフレーズ学習、第2ステップとして単語や文法、というのも理にかなっている。

さらにとにかく継続するための方法にも触れられており、私のようなタイプに向けた配慮が行き届いている。私自身、ジム継続を同じような方法でやっているので、実感を持って読むことができた。

一度中断しているイタリア語学習を、本の中の方法でまたやってみようかな。

次に読んでいる本

仏教の大東亜戦争 (文春新書)

作者:鵜飼秀徳
文藝春秋

Amazon

何を「裏切り」と感じるか

AIはなぜ「裏切ってしまう」のか

Temperature とランダムサンプリング

コンテキストウィンドウとその限界

指示の優先順位とシステムプロンプトとの衝突

情報の鮮度

ハルシネーション

人間はなぜ「裏切られてしまう」のか

過度の人格化

信頼の構築と崩壊

生成AIとの上手な付き合い方

AIはあくまでツールであるという割り切りと、儀式化

コンテキストウィンドウを意識した会話

鵜呑みにしないこと

さいごに

感想

おすすめしたい人

次に読んでいる本

感想

おすすめしたい人

次に読んでいる本

感想

おすすめしたい人

次に読んでいる本

勉強法

出題傾向

感想

1. 序論

2. 視認性のための工夫

3. 影響要因

4. 特例事例：宗教画の光背

5. 補遺：現代文化における再解釈

6. 結論

感想

おすすめしたい人

次に読んでいる本