ms是什么单位| 沈阳为什么叫盛京| 白凉粉是什么东西| 下巴长痘什么原因| cupid什么意思| 周正是什么意思| 桐五行属什么| 一级警长是什么级别| 什么的山| hiit是什么意思| 腰椎生理曲度变直是什么意思| 梦见晒被子是什么意思| 意大利面是用什么做的| 降头是什么意思| 真菌感染用什么药好| 嘴苦是什么原因| 诺如病毒吃什么药好得快一点| 维生素c什么时候吃| 生旦净末丑分别指什么| 骨骼肌率是什么意思| 结婚长明灯有什么讲究| 武装部部长是什么级别| 什么情况下做心脏造影| 五海瘿瘤丸主要治什么病| 支队长是什么级别| 牙龈萎缩 用什么牙膏好| 宫颈管少量积液是什么意思| 梦见剪指甲是什么意思| 太阳是一颗什么星| vana是什么牌子| 胆的作用和功能是什么| 追求完美的人什么性格| 为什么胸会痒| 小朋友眼袋很重是什么原因| 喇叭裤配什么鞋子好看| 煜什么意思| 息斯敏是什么药| 包皮红肿瘙痒用什么药| 耳聋吃什么药| 按摩有什么好处| 什么西瓜好吃| 炖鱼放什么调料| 危楼是什么意思| 1月12日是什么星座| 林子祥属什么生肖| 春风什么什么| 今年属于什么生肖| 核磁是检查什么的| 姐姐的小孩叫什么| 科级干部是什么级别| 96年出生的属什么| 蒲公英吃了有什么好处| 天长地久是什么意思| 梅花什么时候开花| 学生吃什么补脑子增强记忆力最快| 生活惬意是什么意思| 白内障用什么眼药水| 琉璃是什么材质| 胰腺炎不能吃什么食物| 先兆临产是什么意思| 二代身份证是什么意思| 宋朝前面是什么朝代| 办护照需要准备什么材料| 辞海是什么书| 痰有腥臭味是什么原因| 屏保是什么| 荷花什么季节开放| 女人养颜抗衰老吃什么最好| 刚怀孕有什么症状| 心脏跳的慢吃什么好| 水浒传为什么叫水浒传| 兔儿爷是什么意思| 什么孩子命里有文曲星| 咽炎用什么药好| 学海无涯苦作舟的上一句是什么| 祛湿气喝什么茶| 渗液是什么意思| 双向情感障碍症是什么病| cps是什么| 业报是什么意思| 产假什么时候开始休| 吃什么可以生精最快| 拟物是什么意思| 脚背浮肿是什么原因引起的| 什么不动| 硫酸是什么| 肠易激综合征吃什么药好| 看胃病挂什么科| 血压低吃什么能补上来| 2017属什么生肖| 一个鱼一个完读什么| 平躺头晕是什么原因| 季夏是什么意思| 感冒吃什么食物比较好| 黄金有什么用| 宫颈柱状上皮异位是什么意思| 固执什么意思| 空腹打嗝是什么原因引起的| 麦冬不能和什么一起吃| 封印是什么意思| 心脏回流是什么意思| 农历11月18日是什么星座| 无间是什么意思| 门槛费是什么意思| 例假可以吃什么水果| 恶寒什么意思| 杨枝甘露是什么东西| 瓠子和什么相克| 气阴两虚是什么意思| 手心脚心热吃什么药| 什么食物嘌呤含量高| 冬虫夏草有什么作用| 被香灰烫了预示着什么| 膝盖疼做什么检查最好| 弃猫效应是什么| 蛇瓜是什么| 熊猫属于什么科动物| 孕早期胎停有什么症状或征兆吗| 画像是什么意思| 爱生闷气的人容易得什么病| 风湿性心脏病是什么原因引起的| 幽门螺杆菌是什么症状| 金鱼可以和什么鱼混养| 忧郁是什么意思| 靴型心见于什么病| 线束是什么意思| 阿西吧什么意思| 厘清和理清的区别是什么| 明月照沟渠是什么意思| 锦纶是什么面料优缺点| 清炖鸡汤放什么调料| 樱菜是什么菜| 为什么瘦不下来| 为什么会流鼻血什么原因引起的| 备孕怀男孩做什么准备| 心肌缺血用什么药效果最好| 白凉粉是什么做的| 为什么会得神经性皮炎| 屁股上长痘痘是什么原因| 梦到乌龟是什么意思| 普惠幼儿园是什么意思| 69什么意思| 1221是什么星座| 长春都有什么大学| 梦见狗打架是什么意思| vj是什么意思| 玛尼是什么意思| 发物都有什么| 甘油三酯高吃什么药最好| 免费查五行缺什么| 胃酸过多有什么症状| 礼物送什么| 牙膏洗脸有什么好处和坏处| 乳头突然疼痛什么原因| 什么叫桑拿| 维生素b族什么时候吃效果最好| 为什么要做包皮手术| 美元长什么样子图片| 荔枝长什么样| 福报是什么意思| 吝啬鬼是什么生肖| 滥竽充数的充是什么意思| 颈椎病最怕干什么活| 痤疮是什么意思| 倒牙是什么意思| 刻骨铭心是什么意思| 明胶是什么做的| 肩周炎属于什么科室| 6月26号是什么日子| 胃胀打嗝吃什么药最好| 鱼蛋是什么| 西瓜有什么功效| 知了什么时候叫| 做雪糕需要什么材料| 我操是什么意思| 周公吐哺天下归心是什么意思| 走之旁与什么有关| 放量十字星是什么意思| 六味地黄丸的功效是什么| 梦见自己吃肉是什么预兆| gn是什么单位| 拔罐之后要注意什么| 犄角旮旯是什么意思| 两女 一杯是什么| 飞刃是什么意思| 薜丁山是什么生肖| 千里江陵是什么意思| 早上吃鸡蛋有什么好处| 猫头鹰属于什么科| 什么颜色招财并聚财| 氯高是什么原因| 肉桂是什么茶| 肚子突然疼是什么原因| 三文鱼配什么酒| 顺其自然是什么意思| 羊五行属什么| 签退是什么意思| 右手小指疼痛预兆什么| 秋天是什么样子的| 银杏果长什么样| 韫字五行属什么| 什么的枝干| 海参头数是什么意思| 榴莲苦是什么原因| 滴虫性阴道炎用什么药| 充饥是什么意思| 降调针什么时候打| 紫砂壶什么泥料最好| 蜘蛛怕什么| 总胆固醇高忌口什么| 手上长斑点是什么原因| 小宝贝是什么意思| 结肠多发憩室是什么意思| lfc是什么意思| 文雅什么意思| 吃什么食物可以降尿酸| 那是什么呢| 什么物流寄大件便宜| 后背疼应该挂什么科| 佳字属于五行属什么| 丹桂飘香是什么季节| 粉黛是什么意思| 17点到19点是什么时辰| 坐月子吃什么补气血| 大于90度的角是什么角| 空调制冷效果差是什么原因| 宗人府是干什么的| 叶酸基因检测是什么| 乳头湿疹用什么药| 什么时候教师节| 梦见女鬼是什么意思| 友友是什么意思| 黑脸娃娃有什么功效| 婴儿口臭是什么原因引起的| 负荷是什么意思| 81是什么意思| 喉咙挂什么科室| 欢是什么动物| 粉丝炒什么好吃| 二尖瓣轻度反流是什么意思| 松茸是什么东西| 感觉牙齿松动是什么原因| 颈部有肿块看什么科室| 普陀山求什么最灵| 月经期间能吃什么水果| 宫颈柱状上皮外移是什么意思| 大便咖啡色什么原因| 纳豆是什么| 口淡无味是什么原因| 桑蚕丝被有什么好处| 卵巢囊肿吃什么食物好| 睚眦欲裂什么意思| 复仇者用什么武器| 江米和糯米有什么区别| 红斑是什么病| 广州有什么山| 喝酒脸红是什么原因造成的| 乳腺看什么科室| 女性前列腺叫什么| 来例假吃什么水果| 眼睛红肿吃什么消炎药| 为什么会甲状腺肿大| 为什么肚子越来越大| 腿困是什么原因| 百度
Generative AI

“2016-2017年度中国青年医生暨十大妇幼天使”新闻发布会

百度 幻想工作后迅速取得级别和岗位的晋升,显然是一种急于求成的浮躁心态,如此心态,难免生产一种盲目求快的干事哲学,对青年学子的成长成才或非好事。

Large language models (LLMs) are revolutionizing how developers code and how they learn to code. For seasoned or junior developers alike, today’s state-of-the-art models can generate Python scripts, React-based websites, and more. In the future, powerful AI models will assist developers in writing high-performance GPU code. This raises an important question: How can it be determined whether an LLM can handle the intricacies of CUDA programming?

ComputeEval is an open-source framework and dataset designed to evaluate LLMs on CUDA code generation. The dataset is designed to evaluate the ability of an LLM to generate correct CUDA code in different areas of parallel programming such as memory management and thread synchronization. The framework is designed to simplify the evaluation of the generated code.

This post will present a look at how ComputeEval works as an evaluation framework, results of our evaluation on state-of-the-art models and what it means for the future of AI-assisted GPU development.

A new benchmark for high-performance GPU code generation

ComputeEval aims to provide a trusted, community-driven benchmark specifically for CUDA and high-performance GPU code. It is inspired by the benchmarks in other languages such as HumanEval. When it comes to CUDA, precision, parallelism, and performance are critical.

ComputeEval consists of the following:

  • Handcrafted real-world CUDA problems: Our team has curated a set of challenges that cover everything from kernel launches and thread management to memory layouts and shared memory utilization. Our initial release features 128 CUDA problems, serving as the foundation for evaluating how well LLMs tackle GPU programming challenges.
  • Functional correctness tests: Code is provided to run functional correctness tests in a sandboxed environment. This means you can safely execute generated code and verify that it works as intended.

To see the code, visit the nvidia/compute-eval GitHub repo. Find the dataset on Hugging Face.

Model performance

Our team evaluated several leading LLMs on ComputeEval to establish baseline performance metrics and understand the current state of AI-assisted CUDA programming (Table 1).

Modelpass@1pass@3
OpenAI o3-mini0.610.74
Anthropic Claude Sonnet 3.70.540.60
Llama 3.1 405b0.40.55
Google Gemini 2.0 Flash Thinking 0.370.52
Table 1. ComputeEval 2025.1 results in state-of-the-art models. OpenAI o3-mini demonstrates the strongest performance in CUDA code generation followed by Anthropic’s Claude Sonnet 3.7 (no-thinking mode)

These results highlight that while LLMs are able to generate valid CUDA code in some basic cases, even the best models still fail to generate correct CUDA code for complex problems and in some cases don’t follow basic instructions that are able to do in other languages, indicating room for improvement in this complex domain.

Get started

ComputeEval isn’t just about measuring how well current models perform, it’s about setting a standard that drives continuous improvement in AI-assisted CUDA programming. Our team wants to push the limits of what LLMs can do in high-performance computing. As an open-source platform, ComputeEval is a resource that the community can trust and build on. By presenting challenges spanning expert topics across CUDA-X libraries and GPU architectures, ComputeEval also drives modernization by leveraging best practices by default.

In this first release, you’ll find 128 carefully designed CUDA challenges. But we’re not stopping there. We are already working on collecting more problems with our internal teams and partners. We will be open sourcing these problems too. Future updates will include refined tests and more detailed metrics that capture not only correctness but also performance measurement.

Seasoned HPC professionals, students, and hobbyists are invited to contribute by running the benchmark on additional models, submitting new CUDA and CUDA library problems through pull requests, and providing general feedback in GitHub Issues. Your feedback and contributions will help shape the future of this benchmark and make accelerated computing better for everyone. To see the code, visit the nvidia/compute-eval GitHub repo. Find the dataset on Hugging Face.

Discuss (0)

Tags

皮肤暗黄是什么原因 男人割了皮包什么样子 丝瓜不可以和什么一起吃 慢性胃炎是什么原因引起的 梦见牙套掉了是什么意思
法西斯是什么意思啊 堪称什么意思 神秘感是什么意思 肝阳上亢是什么意思 脖子黑是什么原因
马蜂泡酒有什么功效 新生儿呛奶是什么原因引起的 女人吃什么提高性激素 双脚浮肿是什么原因 面部填充用什么填充效果好
发票抬头是什么意思 小麦粉可以做什么吃的 多尔衮是什么意思 气血不足吃什么中药 排卵期是在什么时候
风湿都有什么症状hcv8jop3ns0r.cn 6月28号是什么星座hcv8jop4ns2r.cn 急性腮腺炎吃什么药hcv8jop1ns2r.cn 百合和拉拉有什么区别hcv7jop6ns4r.cn 最大的恐龙是什么恐龙hcv8jop9ns5r.cn
月经是黑色的是什么原因hcv8jop3ns6r.cn 西洋参不适合什么人吃hcv8jop8ns9r.cn 尿路感染不能吃什么东西hcv9jop3ns5r.cn 生姜和红枣煮水喝有什么作用hcv9jop2ns9r.cn 什么是癔病hcv7jop6ns3r.cn
麦冬是什么hcv7jop5ns3r.cn 心脏不好挂什么科sanhestory.com 气管痉挛是什么症状hcv8jop6ns7r.cn 脊柱侧弯拍什么片子hcv7jop9ns6r.cn 二级警监是什么级别hcv9jop1ns8r.cn
肠胃不好吃什么水果比较好hcv8jop0ns3r.cn 又什么又什么造句hcv8jop2ns5r.cn 吃什么性功能持久hcv7jop6ns9r.cn 腊月初七是什么星座hcv8jop6ns6r.cn 鹅喜欢吃什么食物hcv8jop0ns2r.cn
百度