現在のAIモデルが依然として苦労しているのは、空間内でオブジェクトをどのように配置できるか、つまり空間世界モデルです。 Tikzは、図を一から作成するためのネイティブパッケージLatexで、これを試すのに適したサンドボックスです。特に視覚的オブジェクトを表現するためのコードを作成する必要があります。 Claude Codeに頼んで、図はtikzを使ってbeamerでPPTスライドのセットを再現してもらいました。文字は完璧でしたが、これが最初の図(左)でした。文字の位置がずれていたり、矢印が間違った場所に入り、中央にランダムに×印が挿入されていた。何度も繰り返しましたが、うまくいきませんでした。 同じタスクをGPT 5.2 Thinkingにも与えました。再現が難しい場合は図を変えてもらい、すべてが重なり合わないように調整するように指示しました。中央の写真は出力で、さらに悪いものでした。画像を出したり、いろいろなプロンプトを試したりしても役に立ちませんでした――これらのオブジェクトが空間でどのように配置されるべきかのモデルがありませんでした。 別のスライドでGemini 3 Proを試しました。こちらが出力(右)です。かなりひどいです。 Tikzは、これらのモデルがどのように進化していくかを研究する良い基準になると思います。