99免费视频-国语对白做受按摩的注意事项-亚洲香蕉-香蕉视频国产-一色桃子av-丰满人妻一区二区三区53视频-国产真实伦对白全集-精品成人无码一区二区三区-欧美激情视频在线播放-国产精品人-久久精品一级片-国精品人妻无码一区二区三区喝尿-亚洲成人中文-av中文字幕在线看-黄色不卡-操韩国美女-日韩亚洲在线观看-久久人人干-青青青国内视频在线观看软件-av 高清 尿 小便 嘘嘘-日本一区二区网站-奇米777视频-手机在线欧美-国产swag在线-香蕉久久夜色精品升级完成-天天干天天操天天谢-国产精品宾馆在线精品酒店-国产精品日韩三级-久久人人精-啊用力干我

谷歌、OpenAI爭相讓旗下AI玩《精靈寶可夢》游戲:衡量AI真正實力

低調看直播

電競體育01月25報道 據科技媒體 Tom's Hardware 今天報道,當今時代我們有無數種跑分測試和評測方法來衡量 AI 的聰明程度與能力,但最近一種相對小眾的測試方法也在 AI 圈內引發關注。

目前,谷歌、OpenAI 和 Anthropic 等 AI 巨頭正在讓自家模型游玩經典的《精靈寶可夢》系列游戲,以此來評估 AI 性能表現。

Anthropic 公司 AI 部門負責人 David Hershey 對此表示:“《精靈寶可夢》之所以能吸引機器學習社區關注,是因為它不像《Pong》等簡單游戲那樣受限。這種游戲對電腦程序來說非常具有挑戰性”。

Hershey 從去年開始在 Twitch 平臺進行直播,每天的日常就是用公司自產模型 Claude 玩《精靈寶可夢》。這名負責人平時的工作就是幫助客戶部署 AI,因此他開直播本質上也是在測試模型。

這名負責人給自家 AI 直播游戲的做法也啟發了不少自由開發者,他們也陸續搞了“Gemini 玩《寶可夢》”“GPT 玩《寶可夢》”等類似的直播節目。

后來,這些直播甚至被谷歌和 OpenAI 注意到,開發團隊有時還會客串直播間親自調整模型參數,在官方力量注入下,Gemini 和 GPT 已經成功通關了 Gam Boy 時代的《寶可夢藍》,目前已在挑戰續作;而 Claude 至今還沒打通任何一個版本。

至于為何要用《寶可夢》評估 AI 性能?Hershey 對此解釋道:“因為它給我們提供了直觀的方法觀察模型表現,還能用量化指標評估性能”。

通常來講,玩家在《寶可夢》系列游戲中需要升級、訓練已有 / 剛抓的寶可夢,還要打敗道館館主來捕捉新的寶可夢。這種游戲流程并非線性,而是充滿著判斷和取舍。

而且,玩家還要經常在游戲中做出選擇:是先冒險挑戰強大的訓練家以獲取珍稀寶可夢,還是穩扎穩打造出一支實力均衡的隊伍。

顯然,人類非常擅長做此類決策,這也是游戲的樂趣所在,但對于 AI 來說,這是一場關乎邏輯推理、風險評估以及長期規劃能力的綜合考驗。

因此研究人員會深入剖析 AI 在游戲里的決策方式,深入理解模型的能力邊界。

Hershey 還會將 AI 玩《寶可夢》的結果分享給客戶以改進控制框架(IT之家注:harness),幫助他們提升算力使用效率,讓模型更高效運轉。

主站蜘蛛池模板: 手机看片你懂的 | 精品久久久久久久久久 | 被c到喷水嗯h厨房交换视频 | 天天干天天干 | 校花喂我乳还玩我视频 | 欧美激情视频一区二区三区不卡 | 美女久久久 | 120分钟淫片免费看 亚洲高清在线观看 | 好妞在线观看免费高清版电视剧 | 久久久久久久久久久久久久久久久久 | 色欲狠狠躁天天躁无码中文字幕 | 光明影院手机版在线观看免费 | 精品欧美 | 欧美丰满少妇人妻精品 | 少妇一区二区三区 | 一级片在线播放 | 日日夜夜精品 | 亚洲精品影院 | 扒下女教师的内衣 | 色爱综合网 | 日韩av电影在线观看 | 樱花视频在线观看 | 邻居公与我做爰 | 亚洲午夜精品久久久久久app | 深夜福利网站 | 人人妻人人澡人人爽人人欧美一区 | 91蜜桃婷婷狠狠久久综合9色 | 欧美又粗又大aaa片 国精产品一区二区三区 | 美女一级片 | 午夜精品久久久久久久99黑人 | 黑人巨大猛烈捣出白浆 | 天天干天天干天天干 | 美女被爆操 | 黄色免费在线观看 | 在线观看成人 | 91美女视频 | 120分钟淫片免费看 亚洲高清在线观看 | av在线天堂 | 特级西西人体444www高清大胆 | 日韩精品视频在线 | 玖玖视频| 日本一级一片免费视频 | 免费黄色小视频 | 日韩一区二区三区在线观看 | 国产精品蜜 | 毛片无码一区二区三区a片视频 | 一区二区三区在线观看视频 | 日韩av免费在线观看 |