但是,”王志刚眼中闪过一丝锐气,“我们绝不会满足于购买ar的公版内核!我们的目标,是基于ar指令集,开发出属于启明芯自己的、拥有完全自主知识产权的、在性能(特别是单核性能和能效比)上能够超越ar公版甚至挑战tel同级别产品的高性能微架构!”
林轩点了点头,表示赞同:“英雄所见略同。ar生态是未来移动和嵌入式领域的主流,我们必须拥抱它。但核心竞争力在于微架构的自主创新!王工,你对我们第一代自研ar微架构,有什么初步的设想?”
王志刚走到白板前,拿起笔,迅速勾勒出一个简化的处理器流水线框图:“我的初步想法是,第一代核心(内部代号可以叫‘苍穹’ - cangqiong),至少要做到乱序执行(out-of-order execution),拥有比较深的流水线(10级以上),配备足够大的指令窗口和重排序缓冲(rob),采用先进的分支预测技术,并集成高效的l1\/l2缓存子系统。目标是在同等工艺和频率下,实现比当时ar最高端的公版内核(如rtex-a8\/a9)显着更高的ipc(每时钟周期指令数)。”
“这是一个极具挑战性的目标。”林轩评价道,“但方向是对的。我们需要一开始就瞄准高性能,而不是满足于做一个简单的低功耗核心。”
接着,他转向约翰·卡特:“john,gpu这边,‘灵猴’n 1主要是为了满足功能机和早期智能手机的需求。但‘夸父’项目的目标显然不止于此。你对我们未来的高性能gpu架构,有什么规划?”
卡特,这位对图形技术充满热情的艺术家型工程师,眼中也闪烁着光芒:“l,自从上次我们确定了‘平台化、可扩展’的思路后,我和团队(主要是他和另外几位图芯老将)一直在思考如何构建一个真正面向未来的统一计算架构(unified putg architecture)。”
“传统的gpu主要面向图形渲染,计算能力是固定的、专用的。但我认为,未来的趋势一定是通用计算(gpgpu)!gpu将不仅仅用于画图,更将成为处理大规模并行计算任务(如科学计算、物理模拟、甚至未来的人工智能)的主力!”卡特激动地比划着,“我