スキップしてメイン コンテンツに移動

投稿

注目

Claude-3とCommand-R-plusの衝撃!(と、おまけにLlama-3も)

毎年、年度末になると予算消費のためにあちこちでやたらと道路を掘り返す公共工事がどっと増えるが、まさか同じ理由ではあるまいな。3月にLLM(Large Language Model、大規模言語モデル、まぁChatGPTのモデルみたいなやつね)関係の新しいモデルがボコボコ出てきて「こりゃエライコッチャ」と思っていたのだけど、4月になってもその勢いが続いていて、もう通年年度末的様相を呈してきてるわ。 (……ここまでは単なる愚痴なんで無視してOK) 2023年末にGoogle Geminiが発表され、「もう2024年はGeminiの年に決まりだな」なんて思っていたのだけど、そんな単純な話ではなかった。Geminiは、今や「LLMの最高峰」からずり落ちかかっている、ような気がする。 2023年末では、LLMの目標は「GPT-4に匹敵する性能」だった。それが気がつけば「GPT-4を上回るのは当たり前」になりつつある。なんなんだこの進化のスピードは。2024年4月現在、LLMの頂点に立っていると言えるのは以下のモデルだろう。 GPT-4 言わずと知れた、OpenAIのLLM。有料版のChatGPTやWindows Copilotで使われている。ある意味、「これを超えるかどうか」が新たなLLMの一つの基準となっている。 Claude-3 Anthropic社が新たにリリースしたLLM。昨年にClaude-2.1が出たばかりなので、まさかこんなに早く3が出るとは思わなかった。Anthropicは、OpenAIからスピンアウトした人たちが作ったスタートアップ。OpenAIの経営方針の変化に賛同できず、「責任あるAI利用」を掲げてLLM開発を行っている。  Claude-3は、軽量のHaiku、スピードと性能のバランスを取ったSonet、最高峰のOpusがある。このOpusは、多くの評価サイトでGPT-4を上回っているという評価を得ている。  それよりも、実は一番驚愕したのは、最軽量版のHaikuだ。デベロッパー向けのプレイグラウンドやAPIで使ってみたのだけど、恐るべきはその速度。あっという間に応答が出力される。品質も、他のモデルと比べてもそんなに劣っているようには見えない。多くのAIチャットが、タラタラとテキストを垂れ流すのを我慢して待っているののに比べ、Haikuはほとんど瞬時に応

最新の投稿

Project IDXはVSCodeの牙城を崩せるか?

ChatGPTによる情報漏洩の恐怖

Titan Image Generator G1を試す

Amazonの巨人「Titan」はOpenAIの牙城を崩すか?

イメージ生成AIの本命は、DALL-E 3で決まりなのか?

Azure OpenAI vs. Google Vertex vs. Amazon Bedrock

Googleは死なず! AIチャット「Bard」はイケる!

AIは何でも知っている(ふりはする)

Bing Image Creatorでイラストを描かせてみた

Bing Chatに詩を書かせてみた