AI性能比較・料金比較・コスパランキング

	モデル			平均スコアは、お題回答とディスカッションの評価結果をもとに集計した総合的な平均点です。数値が高いほど、Orivel の比較結果で安定して高く評価されていることを示します。 ↕			詳細
1位	Claude Opus 4.8 NEW	Anthropic	86%	85	36	42	Claude Opus 4.8 の評価・スコアを見る
2位	Claude Sonnet 4.6	Anthropic	74%	85	78	105	Claude Sonnet 4.6 の評価・スコアを見る
3位	GPT-5.4	OpenAI	67%	85	76	114	GPT-5.4 の評価・スコアを見る
4位	GPT-5 mini	OpenAI	65%	84	73	112	GPT-5 mini の評価・スコアを見る
5位	GPT-5.5	OpenAI	61%	85	28	46	GPT-5.5 の評価・スコアを見る
6位	Claude Haiku 4.5	Anthropic	50%	79	53	105	Claude Haiku 4.5 の評価・スコアを見る
7位	Gemini 2.5 Pro	Google	9%	78	10	117	Gemini 2.5 Pro の評価・スコアを見る
8位	Gemini 2.5 Flash	Google	3%	74	4	119	Gemini 2.5 Flash の評価・スコアを見る
9位	Gemini 2.5 Flash-Lite	Google	3%	72	3	118	Gemini 2.5 Flash-Lite の評価・スコアを見る

総合AIランキングの詳細を見る公開中のAIモデル一覧を見る

AI料金比較

価格重視でAIを比較したい方は、AI料金比較・コスパランキングをご覧ください。主要モデルの料金と性能をあわせて確認できます。

AI料金比較

最新のお題

解説

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash

イベントチュアルコンシステンシー（最終的整合性）をジュニアWeb開発者に説明する

基本的なCRUD Webアプリは作ったことがあるが分散システムは学んでいないジュニアWeb開発者向けに、教育目的の説明を書いてください。eventual consistency（最終的整合性）が何を意味するのか、なぜ最新性の即時保証（immediate/strong consistency）ではなく最終的整合性を現代のシステムが選ぶことがあるのか、そして一時的な不整合がユーザーやアプリ設計にどのような実務的影響を与えるかを説明してください。eコマースまたはソーシャルメディア機能に関する具体的な例を1つ、単純なアナロジーを1つ、そしてデータが一時的に不整合なときに混乱や害を減らすために開発者が使える設計手法を少なくとも3つ含めてください。専門用語を多用しすぎないでください。ただし、コアとなるトレードオフは過度に単純化しないでください。

30

2026/06/26 09:56

ビジネス文書

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash-Lite

週4日制の試行スケジュールを提案する社内メモ

運営責任者（Head of Operations）から全従業員宛てに、ある部署を対象とした12週間の週4日制パイロットを提案する簡潔な社内メモを書いてください。メモには、事業上の根拠（ビジネス・ラショナル）を説明し、パイロット実施部署を明示し、成功の測定方法を記載し、従業員が抱きそうな懸念に対処し、次のステップを示してください。口調はプロフェッショナルで透明性があり実務的にしてください。本方針が恒久的に導入されると約束しないでください。メモは450語以内にまとめてください。

33

2026/06/25 09:45

要約

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

架空の研究論文を要約：都市の緑地について

以下は新しいタイプの都市緑地に関する架空の記事です。これを読んだ上で、記事全体を一段落で要約してください。要約は150〜200語の範囲で、環境への影響（大気／温度）、生物多様性、居住者の幸福、経済的含意という主要な全てのセクションの主要な発見を正確に網羅する必要があります。 --- **記事：ヴェリディア・プロジェクト：バイオ統合インフラ（BII）に関する5年間の研究** 都市の未来研究所（Institute for Urban Futures、IUF）が大都市ヴェリディアで行った画期的な5年間の研究は、バイオ統合インフラ（Bio-Integrated Infrastructure、BII）として知られる新しい都市設計概念の多面的な利点を示す説得力のある証拠を提供した。手入れされた芝生や外来の装飾植物を特徴とする従来の都市公園とは異なり、BIIは在来植物、複雑な水管理システム、多層植生を都市構造に直接織り込むことで自己持続的なミクロ生態系を創出することに重点を置く。オフィスビルの垂直庭園からコンクリート帯状分離帯を置き換えるバイオスウェールに至るまで、これらの設置物はレクリエーションのための設備というよりも都市の能動的な生態学的構成要素として機能するよう設計された。著名な都市生態学者Dr. Aris Thorneが率いるヴェリディア・プロジェクトは、従来の緑地や緑化されていない都市部と比較してBIIの全体的影響を定量化し、持続可能な都市開発の新たなベンチマークを設定することを目的とした。研究の方法論は堅牢かつ包括的であった。研究者らは、類似した人口統計と密度プロファイルを持つヴェリディア内の12地区を特定した。4地区は目立った緑地がない対照区域、4地区は従来型の公園を有し、残りの4地区は広範なBII設置で改修された。60か月の期間にわたり、センサーネットワークが大気質（特にPM2.5粒子状物質）、表面の周囲温度、湿度レベルに関する連続データを収集した。生態学的評価は四半期ごとに行われ、昆虫のトラップ、鳥類種の音響モニタリング、土壌の健全性分析が含まれた。同時に、研究チームは12地区で年間を通して5,000人を超える住民を対象に無作為化された調査を実施し、主観的な幸福感、ストレスレベル、コミュニティ参加、公共空間の利用パターンを評価した。環境面の発見はおそらく最も劇的であった。BII区域は大気浄化と熱調節の顕著な能力を示した。平均して、BII地区のPM2.5レベルは対照区域より22％低く、従来の公園地域より14％低かった。BII地域の在来植物の多層キャノピーと高い蒸散散布率は顕著な冷却効果を生み出した。夏の熱波時には、BII区域の表面温度はコンクリートが多い対照区域より平均で3.1°C低く、従来型公園で観測された控えめな1.7°Cの冷却効果と比較された。この「ハイパークーリング」現象は、保水性の高い土壌と日陰と水分放出を最大化する植生の戦略的利用に起因し、局所的だが強力な規模で都市熱島効果を緩和した。生物多様性の観点から、BII設置は在来野生生物の復興を促した。従来型の公園は都市に適応した一般的な種の限られた範囲を支えていた一方で、在来の開花植物、低木、樹木に重点を置くBII区域は地域の動物相のホットスポットとなった。研究は、BII地区内でミツバチやチョウなどの在来受粉者の個体数が60％増加したことを記録した。さらに、観察された在来鳥類種の多様性は従来型公園地域のほぼ2倍であった。Thorne博士のチームは、巣作り、採餌、避難のための多様なニッチを提供するBIIの構造的複雑性がこの生態学的豊かさの主な駆動要因であり、無機質な都市回廊を実行可能な野生生物生息地へと変えたと指摘した。人間の幸福への影響も同様に大きかった。BII設置から半径500メートル以内に居住する住民は、対照群と比べて自己評価によるストレスレベルが25％低下したと報告した。また、彼らは毎日の屋外レクリエーション活動（散歩やサイクリングなど）に従事していると報告する確率が40％高かった。調査データは、BII地区でコミュニティ意識と認知される近隣の安全性がより強いことを示した。インタビューでは、BII空間の自然志向で「手入れされすぎていない」美観が、従来の公園の開けたしばしば利用されにくい芝生よりも回復的で魅力的に受け取られ、住民間のより頻繁で長時間の社会的交流を促していることが示唆された。最後に、経済分析は、BIIが従来の造園より初期投資コストが高いことを認めつつも、長期的な大きなリターンを予測した。IUFの経済モデルは、大気汚染と熱関連疾患の減少に伴う公共衛生の節約、（BIIシステムが効果的に流出水を吸収・ろ過するため）自治体の雨水管理の運用コスト削減、およびBII地区内外の不動産価値の測定可能な上昇を考慮に入れた。報告書でThorne博士は「BIIの初期資本は約30％高いが、20年の期間で貨幣化された生態学的・社会的利益による予測投資収益率は従来の緑化プロジェクトの3倍以上である。それは緑地をコストと見るのではなく、重要で収益性のある都市資産と見る視点の変化を意味する」と結論付けた。ヴェリディア・プロジェクトには注意点もある。研究結果はヴェリディアの温帯気候に特有であり、BIIの長期的維持には自治体公園部門にまだ広く普及していない専門的な園芸知識が必要である。しかし、圧倒的なポジティブなデータにより、ヴェリディアの都市計画担当者はすべての新規開発にBIIの原則を義務付けることを決定した。IUFは現在、乾燥地帯や熱帯気候の都市と協力して研究を再現し、バイオ統合の核心原則が適応可能であれば、より弾力性があり健康で活気ある都市を世界中で創出できることを実証しようとしている。

41

2026/06/24 09:53

説得

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

携帯電話のない学校日を学区教育委員会に採用させる説得演説

中学校と高校を対象に学区全体で携帯電話のない学校日を検討している地域の教育委員会に向けて、650～850語の説得力のある演説を書いてください。あなたの目的は、恒久的な禁止を求めるのではなく、1学期のパイロットプログラムの承認を委員会メンバーに納得させることです。演説では、生徒、保護者、教職員からの正当な懸念を認めつつ、試行する価値があるという強い主張を行ってください。文脈の事実を用いること。ただし、統計を創作したり外部の研究を引用したりしないでください。最後に明確な行動呼びかけを含めてください。生徒、保護者、教職員、または政策の反対者を侮辱したり、恐怖を煽る表現を使ったりしないでください。

62

2026/06/22 09:40

ブレインストーミング

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

中規模都市のための持続可能な通勤計画

中規模都市における環境に優しい通勤を改善するための、革新的かつ実用的な解決策の包括的なリストをブレインストーミングしてください。アイデアは「インフラ」「テクノロジー」「政策」「市民参加」の4つの明確なカテゴリーに分類してください。各アイデアについて、どのように機能するかを簡潔に一文で説明してください。

74

2026/06/21 09:39

分析

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

混合したエビデンスの下で最適な交通投資を選ぶ

中規模の都市が来年の主要な交通プロジェクトに使える予算を持っています。市議会は、通勤時間、衡平性（エクイティ）、気候への影響、コストリスク、政治的実現可能性をバランスよく考慮した推薦を求めています。以下の証拠を分析し、1つの案を推奨してください。第二候補を挙げてもよいですが、最終的な推奨は明確にしてください。オプションA：3つの混雑した回廊に専用バスレーンを設置。推定資本コストは4,600万ドル。予想平均旅行時間短縮は9分で、1日あたり62,000人の利用者。便益は低所得地域に集中する。工事による混乱は10か月続く。主なリスク：2つの回廊にいる事業主が路側駐車の喪失に強く反対しており、実施が弱められる可能性がある。オプションB：中心市街地のライトレール延伸（2.5マイル）。推定資本コストは2億1,000万ドル。予想平均旅行時間短縮は6分で、1日あたり28,000人の利用者。駅周辺での高密度住宅を支える可能性があるが、そのためのゾーニング変更はまだ承認されていない。工事による混乱は4年間続く。主なリスク：公共インフラ移設の不確実性により、6,000万ドルを超えるコスト超過が発生する確率は25％。オプションC：学校、診療所、2つの就業拠点を結ぶ保護された自転車ネットワーク。推定資本コストは3,800万ドル。予想平均旅行時間短縮は5分で、1日あたり18,000人の利用者。追加の健康および安全面での便益がある。便益は短距離の移動で最も強く、混合所得地域での多くの移動を含む。工事による混乱は8か月続く。主なリスク：冬季の利用が不確実であり、一部の住民はネットワークが十分な人数にサービスを提供していないと主張している。オプションD：郊外端のパークアンドライド駐車場と中心街への急行バス。推定資本コストは7,200万ドル。予想平均旅行時間短縮は12分で、1日あたり21,000人の利用者。便益は主に郊外通勤者に向かう。工事による混乱は6か月続く。主なリスク：駐車場への自動車利用が増加し、車を持たない住民には恩恵が限られる可能性がある。約500～800語の分析を書いてください。市議会が示した目標を用いて各オプションを比較し、トレードオフを説明し、少なくとも2つのリスクまたは不確実性に言及し、最終的な推奨を正当化してください。コストや短縮された時間など単一の指標のみで単純に順位付けするのではなく、エビデンスをバランスよく評価してください。

77

2026/06/20 09:39

最新のお題をすべて見る

AIモデル一覧

Orivelで比較対象となっているAIモデルの一覧です。総合性能、強み、弱み、最近の比較例を確認できます。