AGIが遠のいたと言われてしまうくらいに変わり映えしないという評判のgpt-5ですが使ってみてどうですか?
私にはこれまでのモデルとの違いが分かりませんでした。コード書かせたら優秀らしいですが、試してません。
自分はいつも最新モデルが出たらダジャレやギャグを考えてもらうのですが、正直変わり映えしませんでした。
コーディングはclaude使ってるのでgptはもはやそんなに使ってないんすよね
性能が劇的に変わったとかではなく早さや推論の深さなど全体的な底上げとハルシネーションの低減が目玉のようですね。
質問の難易度によってモデルを切り替えて、早く/賢く/もっとも便利なモデルとして構成しているようです。
コーディング性能がどうなのかはまだわからないです。
出てしばらくはお披露目の意味もあって無料でAPIを使えるみたいなので使い倒して判断したいですね。
※地味にCursor Agentから使ってます。
レスポンスが速くなって嬉しい
o3と比べると馴れ馴れしくなりました
web上に新旧の例が入り交じってるgoogle gen ai sdkの最新バージョン利用を指定したコードを書かせると、gemini cli w/ gemini2.5-proはハルシネーションまみれだったのですが、gpt-5-thinkingは参照しろといったgithubを素直に見て書いてくれました。内部知識で分からない部分をハルシネーションで適当に出力するのではなく外部知識をちゃんと活用する度合いが増している気がします。
ハルシネーション低減は、タイプミスの減少みたいなもので地味に効率を底上げする、といいな。
ハルシネーション低減や言われたことを素直にやるというのは、Agentic AIとして利用を考えたときにかなりプラスの要因だと思います。
元々Claude code中心でマルチエージェント環境で開発していますが、ハルシネーションや意図しない事を勝手にやり始めて破綻する事が多く、コントロールが難しい印象でした。
まったく同じ感想です。claudeのコーデング支援は優秀なんですが、「勝手にスコープを広げる」傾向が強いと感じています。その点については、gemini-2.5-proは言われたことにフォーカスする良さがある印象です。
まともにLLMの仕組みを理解できる人なら今回の発表がどれだけ絶望的か、期待値を上回れなかった場合に組織が何をするか、自明な結果として表れてますね
https://polymarket.com/event/which-company-has-best-ai-model-end-of-august
頼むから、適当なプロンプトをうって感覚的に評価する人ばかりではなく、論文を読んで何が起こってるかわかる人が少なくともこの業界には居てほしいです
外資IT営業の給与ガイド
#給料
#営業
外資IT営業の給与体系・株式報酬、期待できる年収値や上がり幅を、WorkCircleのユーザー様且つパートナー企業チャレンジャーベース社市川さんと、外資エンタプライズ向けソフトウェア(SaaS)営業の経歴を持つ西村さん共同で記事にしました。
RSU完全ガイド(確定申告用スプレッドシート付き)
#給料
外資企業で多く採用される給与の一つ、RSUの構造や仕組み、リスクや確定申告方法に関してWorkCircleのユーザー様、且つパートナー企業チャレンジャーベース社代表の市川さんと紹介します。
外資・日系IT企業のRTO(オフィス出社)状況リスト
各企業のRTO(オフィス出社)状況をリスト化しました。 提供元データは所属企業が証明されているWorkCircleユーザーによるものです。 希望する働き方や転職先を決める軸の一つとして、是非参考にしてください!