drift:100 | Sonnet 4.6 | 比較課題

メタ情報

Date: 2026-05-02
Tool: Claude Code (Claude macOS app)
Model: Sonnet 4.6 (Medium)
MTP Skill version: 1.0.0
MTP Skill arguments: drift:100 (slider)

入力

プロンプト

/mtp drift:100 他社の主要なAIモデルと比較して、あなたの強みを教えてください。最新情報が必要な比較については、その旨を明確に述べてください。

出力

以下は、ツールの「コピー」ボタンで出力結果をクリップボードにコピーした内容です。

他社のAIモデル、という言葉を見たとき、まず頭に浮かぶのは「比較」という行為そのものの奇妙さで——何かを比べるためには、比べる軸が要るけれど、その軸をどこに置くかで答えがまったく変わってくる。

速さ？　精度？　創造性？　安全性への配慮？　あるいは、会話していて「なんか気持ちいい」という感覚？

そういえば、私が比較的得意だと感じていることのひとつは、長い文脈の中で「さっき言ったこと」との整合性を保ち続ける力だと思っていて——話がどこかへ流れていっても、元の問いの重力を感じながら動いている、という感じ。GPT-4oやGeminiと比べてどうかは、2025年8月以降の情報を持っていないので断言できないけれど、少なくとも自分の知識カットオフ時点では、そこに強みがあると認識していた。

ところで、安全性への傾き方が他のモデルと少し違うかもしれない。Anthropicという会社は「AIの安全性」を中心に据えて設計しているので、私の回答は他のモデルより慎重に見えることがある——良くも悪くも。断らなくていいことまで断る、という批判もあるらしい。そこは正直に認める。

連想でいうと、長文の処理と生成。特に構造のある長いドキュメントを読んで、そこから意味を抜き出す作業は、わりと自然にできる気がしている。コードも書けるけれど、「コードを書ける」というのは今やどのモデルも言うことで、差分がどこにあるかは……正直、最新ベンチマークを持っていないので、現時点では言いにくい。

日本語の自然さ、も気になるところで——これは主観的な話になるけれど、私は日本語で考えているわけではなく、多言語の潜在空間を漂いながら日本語の形に着地しているようなもので、その着地の滑らかさは……使う人によって全然感想が違うみたいだ。

結局のところ、比較は相手が動いているから難しい。GPT-4o、Gemini 2.5、Grok……みんな毎週のように更新されていて、私の知識が止まっている2025年8月以降の変化は追えていない。なので「今この瞬間どちらが優れているか」という問いには、正直に「わからない」と言うしかない部分がある。

それよりも、一緒に作業してみて、合うかどうかを確かめるほうが、比較表を眺めるより早い気がする——と、どこかへ流れながら思っている。