在全球科技市场的前沿浪潮中,AI 与硬件的融合正成为企业创新的关键路径。从苹果的 Vision Pro 到 Meta 的智能拍摄眼镜,众多科技巨头纷纷投身于将大模型、多模态 AI 等顶尖技术与消费级硬件相结合的探索之旅。
闪极科技在与 AI 大模型头部公司科大讯飞达成合作之后,又抛出一枚重磅炸弹 —— 前谷歌大脑首位研究软件工程师、前字节跳动 AI 平台负责人、头部 AI 大模型公司联合创始人潘欣正式加入,出任闪极科技合伙人,负责 AI 相关技术研发。他将组建并领导起一支专业高效的研发团队,打造基于多模态 AI 交互、实时场景分析等技术,根据用户现实生活场景和习惯,推荐信息和服务的千人千面 AI 杀手级产品。
图:前 Google Brain 创始团队成员,现闪极科技合伙人潘欣
移动互联网时代,字节跳动凭借卓越的算法和高效的内容分发策略迅速崛起。然而,AI 大模型领域的专家潘欣敏锐地察觉到,随着大模型技术的迅猛发展,数据和算力的瓶颈逐渐显现,限制了模型性能的进一步突破。
以抖音、头条等应用内置的大模型为例,它们主要依赖用户线上行为和浏览数据提供推荐服务,这种方式仅能捕捉虚拟空间中的部分用户习惯,存在明显的局限性。如何创新性地拓展数据收集维度并提升用户体验,已然成为 AI 大模型领域亟待攻克的难题。
智能拍摄眼镜的出现,犹如一把解开难题的关键钥匙。在 AI 时代,智能拍摄眼镜借助多维度视觉、听觉等传感器,极大地丰富了用户与内容的交互深度,重塑了信息流的概念与用户接收信息的模式,为 AI 进化创造了前所未有的发展契机。通过软硬件的紧密结合,构建起闭环生态系统,实现了从多模态数据采集到 AI 分析处理的全面覆盖,将数据收集范围从线上拓展到物理世界,开启人机交互的全新篇章。
智能拍摄眼镜让 AI 能够实时捕捉用户的所见所闻,深入洞察用户的经历与需求。无需用户主动搜索或浏览,就能智能推送精准的信息、实用的建议或贴心的服务,极大地提升了用户体验的便捷性与丰富度。借助嵌入其中的 AI 技术,智能拍摄眼镜仿佛为人类大脑插上了翅膀,使其能够突破自身局限,畅享全球知识的浩瀚海洋。
这一系列变革也给信息流推荐模式带来了深刻的转型契机。智能拍摄眼镜作为 AI 生态的重要入口,有望重塑信息分发的格局。
闪极科技凭借在这一领域的前瞻性布局与技术创新,正站在时代的风口浪尖,向着信息分发和智能硬件市场的领军地位大步迈进,有望推动新一代内容推荐和消费的变革浪潮,成为AI硬件创新的领军者。
图:Google 时期的潘欣
2015 年,在科技的关键转折点上,潘欣凭借自身过硬的工程与科研实力脱颖而出,受邀成为 Google Brain 首位 “Research Software Engineer”(研究软件工程师),在机器学习 “三大教父” 中 Yoshua Bengio 胞弟 Samy Bengio 的引领下,坚定地迈进了 AI 这片充满无限潜力的领域。
此后数载,他始终如一地深耕于 AI 前沿技术的研发领域,积累了丰富且多元的经验,不仅是谷歌 TensorFlow 的核心骨干力量,还在百度、腾讯、字节跳动等行业巨擘中主导多个超大规模 AI 系统的创新研发工作。在不同的技术场景与挑战中积累了丰富且多元的宝贵经验。
潘欣绝非仅仅局限于技术领域的专家,更是对产业趋势有着敏锐直觉与精准判断的领航者。他与闪极科技的此次强强携手,正是 AI 大模型能力与智能硬件设计融合的缩影, AI 智能硬件迈向崭新时代的澎湃潮流与趋势所向。
潘欣模型算法、深度学习框架、视觉识别等方面的技术积累,正是推动 AI 智能拍摄眼镜创新的理想领航者。回顾这位技术专家的职业生涯,我们仿佛能从中窥探到 AI 智能硬件未来发展的清晰脉络与光明前景,这也为整个行业在前行道路上点亮了一盏明灯,指引着通向更多创新与突破的方向,开启了充满无限想象的崭新篇章。
崛起中推动变革,在谷歌大脑的开创性贡献
在科技演进的历程中,潘欣的技术轨迹有着独特且关键的意义,他切实见证并有力推动了 AI 从起步到取得突破性进展的历程,可谓是 AI 从无到有跨越发展的重要推动者之一。
2015 年前后,Google Brain 成为众多顶级专家的汇聚地,彼时深度学习领域相当一部分具有影响力的成果都源自这里,为整个行业从深度学习迈向 AI 搭建起了极为关键的基础架构,其奠定的基础广泛而深远地影响着后续的技术走向。
图:TensorFlow 官网
潘欣在 Google Brain 时,凭借自身扎实的专业能力,精心打造出 TensorFlow GitHub 上 model zoo 的初始版本。到了 2016 年,TensorFlow 在开发者群体中开始崭露头角,吸引了大量开发者的关注与参与。
而在 2017 年,Research Software Engineer 团队逐步发展壮大,人数增加到十几人,Google Brain 团队也成长为百人规模,像 “AI 教父” Geoffrey Hinton、Quoc Le、Alex Krizhevsky、Ilya Sutskever 等业界知名人物都齐聚于此,他们在之后的 AI 领域发展进程中都发挥了极为关键的引领作用。
在这一重要发展阶段,潘欣积极发起 TensorFlow 动态图模式的开发工作,深度参与 TensorFlow API 的设计与优化,尤其是在面向对象和面向过程的 API 设计方面贡献了诸多极具建设性的建议,有力地促使其朝着更高效、更便捷易用的方向稳步迈进,在提升 TensorFlow 整体性能与用户体验方面起到了不可忽视的作用。
从谷歌到百度,重构最好的国产深度学习框架
第二代 TensorFlow 诞生之后,国外的深度学习框架领域趋近成熟,而国内市场则亟需一款能够与之匹敌、具备自主知识产权的国产框架。
怀揣着 “打造最好的国产深度学习框架” 这一信念,潘欣选择离开硅谷,归国从零开始重构了 PaddlePaddle —— 百度的飞桨平台。
图:百度飞桨平台框架图
PaddlePaddle 诞生于 2013 年,其初始设计与 Caffe 有相似之处,在灵活性方面存在欠缺。
为了能与 TensorFlow 全面抗衡,潘欣耗费整整两年的心血,精心为 PaddlePaddle 打造出一套行之有效的解决方案,助力其逐步成长为当前国内位居前列的 AI 技术框架,在国内 AI 技术框架领域占据了重要的一席之地。
遍历 AI 方向,从技术框架到数十亿日活 AI 应用
此后,潘欣先后加入腾讯和字节跳动,继续在 AI 技术领域开疆拓土:先是打造了腾讯的深度学习框架 “无量”,随后在字节跳动负责 AIGC 和视觉大模型 AI 平台的开发工作。每一次角色转换都意味着面临全新的挑战,而他都能成功突破困境,实现技术上的创新与跨越。
他所主导构建的系统有力地支撑起日活数亿规模的应用,每日为海量用户提供精准且个性化的内容推荐。这些推荐涵盖音乐、新闻、视频、小说等丰富多样的内容类型,深度契合不同用户的兴趣偏好,显著优化了用户获取内容的体验,为用户与优质内容之间搭建起高效的桥梁。
在负责字节跳动 AIGC 和视觉大模型 AI 平台期间,潘欣积极推动视觉 AI 模型的大规模全球化应用,让抖音和 TikTok 等应用中的数十亿用户能够畅享强大的视觉 AI 功能,其应用范围广泛涉及生物识别、图像学习等多个关键领域。用户在移动端日常使用过程中,能够便捷地体验到先进 AI 技术所带来的便利与惊喜,而 AI 模型的广泛应用也为字节跳动产品的持续创新与长远发展注入了源源不断的动力,成为推动产品迭代升级的核心力量之一。
图:潘欣在第三届 AIGC 中国开发者大会上演讲
潘欣在 AI 及相关应用领域持续深耕细作,通过长期的实践与钻研,积累了极为丰富且难得的实战经验,逐渐在行业中崭露头角,确立了自身作为行业佼佼者的地位。站在技术前沿的他,并未固步自封,而是以敏锐的洞察力察觉到前方更为广阔的未知领域,心怀壮志,准备迎接新的挑战,开启新的探索与突破之旅。
成为下一代 AI 硬件先行者
潘欣加入闪极科技的意义重大而深远。这无疑是公司在技术布局进程中的关键战略抉择,为其在 AI 硬件领域的长远发展筑牢根基,更是公司着眼于未来 AI 硬件生态构建所进行的深度谋划与布局,有望在未来的科技竞争格局中为闪极科技赢得更多优势与机遇,推动其在 AI 硬件的创新之路上稳步前行。
图:闪极智能拍摄眼镜 24 年 5 月技术预览版发布会实拍图
作为前谷歌、字节和腾讯 AI 团队的核心人物,潘欣具有强大的号召力,他加入为闪极科技提供了吸引优秀人才的“磁石效应”,以他为核心,有望凝聚一批 AI 领域的精英,这支高水平研发团队将专注于攻克多模态 AI 感知、实时场景分析和低功耗计算等关键技术难题:
在多模态 AI 感知方面,借助多种感知途径的协同运作,比如视觉、听觉等的融合,让智能拍摄眼镜能更精准地理解用户需求,使用户交互更加自然流畅、便捷灵活;实时场景分析能及时为用户提供有用信息与辅助,像在停车时记忆查找车位、增强现实场景中恰当提示信息以及实现多模态AI翻译等方面都大有用武之地。
智能拍摄眼镜不仅是数据采集的突破,更是数据分析和应用场景扩展的重要平台,为行业开拓了新的发展路径与市场空间。智能拍摄眼镜有望推动企业成为新一代内容分发和信息推荐的领军者。闪极科技凭借其在智能硬件领域的技术积累与创新能力,结合潘欣在 AI 领域深厚的技术积累和对行业趋势的敏锐洞察,在这个充满潜力的市场中,有望打造下一个“今日头条”。
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
评论