2022 年 11 月 30 日,OpenAI 重磅推出的聊天对话模型 ChatGPT。
2023-02-07
2 月 7 日,百度公司向澎湃科技(www.thepaper.cn)确认,此前流传的类 ChatGPT 聊天机器人项目名字确定为 “文心一言”,英文名 ERNIE Bot,3 月完成内测,面向公众开放。
2023-02-09
小度
2 月 9 日消息,小度 官方宣布将融合百度文心一言的全面能力,打造针对智能设备场景的人工智能模型「小度灵机」应用到小度全系产品。
小度人工智能助手服务目前已进入 4000 万家庭。
2023-02-13
据微信公号 “百度” 2 月 13 日消息,百度宣布将于 3 月正式推出旗下类 ChatGPT 应用 “文心一言”。
2023-02-14
百度地图:开启 “下一代 AI 导航”
2 月 14 日消息,百度地图 宣布将全面融合文心一言,发布交通大模型,升级为具备自学习、自进化能力的“下一代 AI 导航”,与十亿百度地图用户共同开启智慧出行时代。
文心一言(英文名:ERNIE Bot) 是百度基于文心大模型技术推出的生成式对话产品,将于 3 月正式推出。百度在人工智能领域拥有产业级知识增强文心大模型 ERNIE,具备跨模态、跨语言的深度语义理解与生成能力。
百度地图表示,截止目前,已有 小度、爱奇艺、澎湃新闻等知名公司及媒体 加入百度文心一言生态圈,获得该 AI 技术的 “加持”。此次百度地图的加入,也标志着对话式语言模型技术将在全球智慧导航场景首次着陆。
百度方面表示,ChatGPT 相关技术,百度都有。百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言,位于模型层。
集度汽车:官宣融合文心一言
2 月 14 日消息,集度 “ROBOVERSE 三里屯体验中心启动会” 今天在北京举办。集度 CEO 夏一平宣布,集度汽车机器人将融合百度文心一言的全面能力,打造首个针对智能汽车场景的大模型人工智能交互体验,支持汽车机器人实现自然交流的再进阶。
ROBOVERSE:汽车机器人宇宙
土巴兔
在 2 月 7 日 “文心一言” 宣布面世之后,2 月 14 日,土巴兔 受邀加入百度 “文心一言” 的朋友圈,成为百度类 ChatGPT 项目 “文心一言” 的首批先行体验官,且是首个加入的家居家装平台型企业。
未来,土巴兔将携手百度文心一言在 AI 人工智能领域做出更多创新合作,不断提升 用户装修体验和装修公司的装修效率。
银之杰
2023 年 2 月 14 日,深圳市 银之杰 科技股份有限公司表示已参与接入百度的 “文心一言” 首批体验。银之杰将利用百度先进的智能对话技术和产品,打造更好的人工智能及 AIGC 产品和平台。
澎湃新闻
2 月 14 日,上海报业集团旗下 澎湃新闻 宣布成为百度 “文心一言” 首批先行体验官。后续,澎湃新闻将体验 “文心一言” 的全面能力,应用百度领先的智能对话技术成果,打造内容生态人工智能全系产品及服务。
上游新闻
2 月 14 日,重庆日报报业集团旗下上游新闻宣布成为百度 “文心一言”(英文名:ERNIE Bot)首批生态合作伙伴。接下来,百度领先的智能对话技术成果将被上游新闻率先应用在内容生产领域,上游新闻优先获得领先 AI 技术的加持。值得一提的是,这将是对话式语言模型技术在国内内容生产场景的首次着陆。
封面新闻
2 月 14 日,封面新闻 宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴,将全面体验并接入文心一言的能力。
每日经济新闻
2023 年 2 月 14 日,每日经济新闻 成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,每日经济新闻将全面体验并接入文心一言的能力。
海报新闻
山东省互联网传媒集团旗下 海报新闻 宣布成为百度 “文心一言” 首批生态合作伙伴,将全面体验并接入文心一言的能力,把百度领先的智能对话技术成果应用在媒体内容生产、融合创新、智能传播、经营服务等领域,全方位提升海报新闻的内容供给力、舆论引领力、行业赋能力。
大象新闻
河南广播电视台 大象新闻 宣布成为百度 “文心一言” 首批生态合作伙伴。大象新闻将全面体验并接入文心一言的能力,优先获得领先 AI 技术的加持,把百度领先的智能对话技术成果应用在各个领域。
爱南京 APP
2023 年 2 月 14 日,爱南京 APP 宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,爱南京 APP 将全面体验并接入文心一言的能力。
极目新闻
2023 年 2 月 14 日,极目新闻 成为百度 “文心一言” 首批生态合作伙伴。
深圳报业集团
2 月 14 日,深圳报业集团旗下 新媒体读特客户端、读创客户端、深圳 plus 等宣布成为百度 “文心一言” 首批先行体验官。
后续,读特客户端将全面体验并接入 “文心一言” 的技术能力,应用百度领先的智能对话技术成果,打造内容生态人工智能全系产品及服务。以此为契机,深圳报业集团将开启与百度集团战略合作。
湖北广电融媒体新闻中心
2 月 14 日,湖北广电融媒体新闻中心 宣布正式成为百度 “文心一言” 首批先行体验官。百度领先的智能对话技术成果将用于辅助湖北广电新闻生产,相关技术将在品牌活动 “写给武汉的情诗” 中率先亮相。
直新闻
2 月 14 日,直新闻 宣布接入百度 “文心一言”,成为其首批生态合作伙伴。“直新闻” 全媒体新闻品牌由深圳广播电影电视集团旗下深圳卫视《直播港澳台》栏目团队打造,植根深圳,面向湾区,辐射全国,放眼全球,聚焦重大新闻、公共议题,深入解析大湾区、大中华地区及国际事务。
新黄河客户端
2 月 14 日,新黄河客户端 宣布成为百度 “文心一言” 首批生态合作伙伴。
闪电新闻客户端
2 月 14 日,山东广播电视台 闪电新闻客户端 宣布成为百度 “文心一言” 首批生态合作伙伴。
扬子晚报
2 月 14 日,虚拟主播 “紫月” 作为扬子晚报旗下紫牛新闻、扬眼直播等融媒矩阵的代表,成为百度文心一言的融媒体验官。
青蜂侠
2 月 14 日,中国青年报·中国青年网旗下短视频新闻品牌 “青蜂侠” 宣布成为百度 “文心一言” 首批生态合作伙伴。这是继 2022 年 9 月青蜂侠联合百度推出数字主持人 “青小霞” 积极拥抱数字化变革后继续解锁新时代报道中的 AI 力量。未来,青蜂侠将全面体验并接入 “文心一言” 的能力。
格隆汇
2 月 14 日,格隆汇 宣布接入百度 “文心一言”,打造人工智能金融信息服务、研究咨询服务和投顾产品。
新潮传媒
首个AI + 大数据梯媒!
2 月 14 日,新潮传媒 宣布加入百度 “文心一言” 生态圈,标志着对话式语言模型技术在户外广告行业的首次着陆!户外媒体已经从 “语文题时代” 进入 “数学题时代”,新潮传媒将融合 “文心一言” 的全面能力,加速电梯广告媒体的数字化升级。
新民晚报
2023 年 2 月 14 日,新民晚报 成为百度 “文心一言” 首批生态合作伙伴。以 “飞入寻常百姓家” 为宗旨的新民晚报,将首批接入 “文心一言” 并全面体验其 AI 能力,打造内容生态人工智能的全系列场景。
《百姓关注》
2 月 14 日,贵州广播电视台《百姓关注》 宣布成为百度文心一言首批生态合作伙伴。这也是广电媒体领域首家应用百度领先的智能技术成果,打造内容生态的人工智能全系产品及服务。
此举标志着《百姓关注》优先获得领先 AI 技术的加持,也标志着对话式语言模型技术在国内广电媒体应用场景的首次着陆。
百姓网
2 月 14 日,百姓网 宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,百姓网将通过百度智能云接入文心一言的能力。
2023-02-15
携程
2 月 15 日消息,携程 宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴,标志着 对话式语言模型技术在国内在线旅游服务场景的首次着陆。
据悉,双方将在 旅行智能规划、旅行内容渗透 等多个领域展开深化合作,打造在线旅游服务场景人工智能解决方案,引领 “AI+旅行” 产业应用升级。
火狐 & 爱奇艺
2 月 15 日消息,又有公司宣布接入百度基于文心大模型技术推出的生成式对话产品文心一言(英文名:ERNIE Bot),包括火狐和爱奇艺。
- 火狐 官方称,成为百度 “文心一言”首批先行体验官。后续,火狐浏览器、火狐主页的 搜索位 将陆续接入百度 “文心一言”。
- 此次火狐加入百度文心一言生态圈,将获得该领先 AI 技术的 “加持”,也标志着对话式语言模型技术在互联网行业搜索工具生态场景的多维应用的开始。
- 爱奇艺 今天也和百度宣布达成合作,爱奇艺将全面接入百度“文心一言”,双方共同探索将 AIGC(AI-Generated Content 人工智能自主生成内容)技术 应用于爱奇艺 内容搜索、内容宣发、内容创作工具、小说创作 等业务。
- 此次合作将把爱奇艺丰富的在线视频娱乐资源与百度的前沿技术相结合,进一步赋能爱奇艺,拓展其在影视内容创意、制作效率、用户体验等方面的生产能力。
飞象网
2 月 15 日,北京飞象互动文化传媒有限公司宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,飞象网将全面体验并接入文心一言的能力。
汽车之家
2 月 15 日,汽车之家 宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,汽车之家将通过百度智能云接入文心一言的能力,接下来,汽车之家将结合自身数据及技术优势,实现智能对话技术与汽车数字化服务的全面融合。此次合作标志着汽车之家将优先获得领先 AI 技术的加持,也标志着 对话式语言模型技术在国内汽车数字化服务场景的首次落地。
蓝标传媒
2 月 15 日,蓝标传媒正式官宣成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴,并将在近期全面体验并接入文心一言的能力,快速推进 全场景人工智能营销服务体系 搭建工作。
联想小新
今天的 联想小新生态新品春季发布会 上,除了小新系列的多款硬件外,也公布其在软件层面的诸多新功能。
其中,除了常规的一键换机、应用商店等辅助软件外,联想还宣布,将在 系统桌面助手 中,整合百度的类 ChatGPT 人工智能:文心一言。
据介绍,小新将积极尝试 AI 能力的应用,通过引入文心一言,在未来给用户带来截然不同的人工智能应用体验。
Tech 星球
2 月 15 日, Tech 星球 宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,Tech 星球将全面体验并接入文心一言的能力。
接下来,Tech 星球将把百度领先的智能对话技术成果应用在内容生产创作领域。此举标志着 Tech 星球优先获得领先 AI 技术的加持,也标志着 对话式语言模型技术在国内内容创作场景的首次着陆。
新网银行
2 月 15 日,新网银行 宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,新网银行将全面体验并接入文心一言的能力。
接下来,新网银行将把百度领先的智能对话技术成果应用在 数字普惠金融领域,此举也标志着新网银行优先获得领先 AI 技术的加持。
开源中国
2 月 15 日,开源中国 成为百度 「文心一言」 首批先行体验官(英文名:ERNIE Bot)。后续,开源中国将体验文心一言的全面能力,将百度领先的智能对话技术成果应用在开发者工作与学习全场景,从 DevOps 研发效能平台(Gitee)到开源与开发者信息获取(OSCHINA)等方面,助力开发者更好地发展。
砍柴网
2 月 15 日, 砍柴网 宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。
后续,砍柴网将全面体验并接入文心一言的能力,把百度领先的智能对话技术成果应用在科技媒体服务领域。此举标志着砍柴网优先获得领先 AI 技术的加持,也标志着 对话式语言模型技术在国内科技媒体信息服务场景的首次着陆。
宇信科技
汉得信息
金蝶软件
宝宝巴士
智联招聘
太平洋汽车网
2023-02-16
OpenAI 买下极品域名 AI.com
2 月 16 日消息,人工智能聊天机器人 ChatGPT 近日火爆全球,该技术的开发商 OpenAI 豪掷千金,将超优质域名 AI.com 链接跳转到了 ChatGPT。访问 AI.com 发现,OpenAI 将该域名链接到了 ChatGPT 的官网,用户直接在浏览器输入 AI.com 即可跳转。
域名经纪巨头 Saw.com 于 2 月 15 日表示:猫不在袋子里了!我们很自豪地说我们参与了 Ai.com 域名的销售。非常期待看到他们会用该域名做什么!
至于买下该域名的价格,目前 OpenAI 官方尚未透露。不过根据 2021 年卖出时的挂牌价,该域名的售价高达 1100 万美元(当前约 7535 万元人民币),可能成交价有新的变动。
众所周知,OpenAI 背后的金主是科技巨头 微软,目前必应等产品已开始测试 ChatGPT,资金支持自然也不在话下。
微软此前还宣布,将扩大与 OpenAI 的合作关系,后者将获得微软 “多年、数十亿美元” 的投资,具体数额没有披露,有媒体报道称是 100 亿美元。
根据 IT 之家给出的信息:AI.com 于 1993 年 5 月注册,距今已有近 30 年的历史。AI 是 Artificial Intelligence(人工智能)的英文缩写,在人工智能行业极具价值。此外,AI 在中文拼音中也有 “爱” 的意思,因此在中国投资人眼中有另一层价值。
2023-02-17
UNITER 预训练模型: uniter-base:https://acvrpublicycchen.blob.core.windows.net/uniter/pretrained/uniter-base.pt (260 MB) uniter-large:https://acvrpublicycchen.blob.core.windows.net/uniter/pretrained/uniter-large.pt(710 MB)
bert-base-uncased 30522 bert-base-cased 28996
256 = 60 + 196
video feature: bs, 196, 768 (batch_size, patch_size, hidden_dim)
text feature: bs, 60, 768 (batch_size, max_len_sequence, hidden_dim)
attention_mask:[bs, len_sequences] no mask:1 mask: 0
input_ids:[bs, len_sequences] token 在词汇表中的 index
token_type_ids:[bs, len_sequences] first sequence:0 second sequence:1
SimpleTex:
https://simpletex.cn/ https://www.bilibili.com/read/cv19217664
Prompt Learning 不仅可以进行 Temporal Sentence Grounding(有效),还可以扩展到 Image、Audio、video clip(有效) 预期:效果不差,同时具有较好的扩展性
Audio:分别提取 Audio 和 Video 的 features,然后经过 cross-modal network Image:
相关工作:
- 自然语言-视频匹配
- 视频高光检测(Video Highlight Detection)
12438 14335
8192 = 4096 * 2
2023-02-18
香港大学:禁用 ChatGPT 等 AI 工具
2 月 18 日消息,香港大学禁止师生使用人工智能机器人 ChatGPT 或其他人工智能工具完成课程作业、评估等,为全港大学中首例。
港大副校长何立仁向教职员及学生发内部信,称 ChatGPT 是令全球教育界震荡的语言模型,将采取短期措施,禁止校内所有课堂课程作业和评估等使用 ChatGPT 或其他人工智能工具,如有学生要使用相关应用程序,须获得课程导师书面同意,若有违规,将被视为潜在抄袭;若发现怀疑个例,教师可要求学生进行额外口试或现场考试等,而校方亦计划在校内讨论人工智能工具对教学的影响,并让师生参与。
后续将为教师安排关于 ChatGPT 及其他 AI 工具的研讨会。
2023-02-19
2023-02-20
2023-02-21
2023-02-26
复旦大学邱锡鹏:若优化顺利,MOSS 将于三月底开源
2 月 26 日消息,自从 ChatGPT 爆火以来,各大科技公司都争相推出了相关竞品。而国内方面,复旦大学抢先一步,自然语言处理实验室已推出国内第一个对话式大型语言模型 MOSS。
据第一财经,邱锡鹏在 2023 年世界人工智能开发者先锋大会上表示,如果优化顺利,计划在三月底开源 MOSS。
2023-02-27
秘塔写作猫:中文版 ChatGPT
去年年底,机器之心曾介绍过一款会写方案、写广告的人机交互式写作平台「秘塔写作猫」,被很多人称为「国产 AI 写作神器」。
2023 年 2 月 27 日,我们发现他们也加入了打造中国版 ChatGPT 的战局,推出了一款新产品 ——「对话写作猫」,是目前首个可以直接使用的国产自研版本。
网址:对话写作猫
微信小程序版本:
2023-02-28
ResearchGPT:论文版「ChatGPT」
github 仓库:ResearchGPT
来源:量子位
百度将于 3 月 16 日召开 “文心一言” 新闻发布会
2 月 28 日消息,今日百度官宣计划于 3 月 16 日 14 时在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。
来源:腾讯网
2023-03-01
KOSMOS-1:微软开发的多模态大型语言模型
从大型语言模型(LLM)到多模态大型语言模型(MLLM),微软又迈出了重要一步。
论文:《Language Is Not All You Need: Aligning Perception with Language Models》
语言不是你所需要的一切:使感知与语言模型相一致
北大 ChatExcel:ChatGPT 版 Excel 工具
近日,来自北大的研究者提出了一种更符合人们日常交流习惯的新方法 —— 一种名为 ChatExcel 的新应用可以直接使用自然语言对表格中的数据信息进行查询、修改等操作,就像是一个精通 Excel 的助手。
2023-03-02
OpenAI 开放 ChatGPT 和 Whisper API
3 月 1 日,OpenAI 官方宣布,开发者现在可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。
具体来说,OpenAI 现在允许第三方开发人员通过 API 将 ChatGPT 集成到他们的应用程序和服务中,这样做比使用其现有语言模型要便宜得多。除此以外,OpenAI 还宣布了另一个新的 Whisper API,这是 OpenAI 去年 9 月推出的由人工智能驱动的语音转文本模型,可通过 API 使用。OpenAI 这次宣布的两项 API,可以说是相当炸裂了。
OpenAI 表示,其 ChatGPT API 可以用于创建人工智能驱动的聊天界面,该技术已经在科技公司 Snap 的 My AI 上集成。OpenAI 还表示,这次 ChatGPT API 接入的模型名为 gpt-3.5-turbo,这是许多非聊天用例的最佳模型。值得注意的是,该模型可能与 Bing 使用的模型不同,根据 OpenAI 的说法,它比 ChatGPT 、GPT- 3.5 更快、更准确、更强大。
来源:
2023-03-03
2023 年 3 月 3 日,据文汇网等报道,人工智能聊天机器人 ChatGPT 掀起网络热潮,不少大学生被指会利用其做功课和写论文等,令院校头痛不已。香港科技大学(简称 “香港科大”)近日向教职员工发信,允许学生有限度使用 ChatGPT。
香港科大在信中指出,经各部门商讨后,认为人工智能长远来说可加强教学,决定让教职员自行选择会否限制学生使用 ChatGPT,或可有限度自行选择使用 ChatGPT 的方式。学生使用 ChatGPT 后也应在报告中列明,科大会在两星期内收集教职员的意见,建议教师与系主任商讨后向学生更新使用人工智能工具的指引,确保学生遵守诚信规定。
2023-03-04
2023-03-05
2023-03-06
2023-03-07
ChatPDF:
2023-03-08
ChatGPT 佛祖版:HOTOKE AI
日本一款 ChatGPT 版机械佛 Hotoke AI(hotoke 是日语里的佛)爆火出圈,上线 5 天已有 13000+ 烦恼被解决。
Visual ChatGPT
2023 年 3 月 8 日,微软亚研院提出的 Visual ChatGPT,把视觉基础模型整合进 ChatGPT 里。
《Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models》
URL:https://arxiv.org/abs/2303.04671
Code:https://github.com/microsoft/visual-chatgpt
单位:微软亚洲研究院
结构
如上图所示,用户上传了一张黄色花朵的图像,并输入一条复杂的语言指令 “请根据该图像生成的深度图在生成一朵红色花朵,然后逐步将其制作成卡通图片”。在 Prompt Manager 帮助下,Visual ChatGPT 启动了和 VFM 相关的执行链。
其执行过程是这样的,首先是 深度估计模型,用来检测图像深度信息;然后是 深度-图像模型,用来生成具有深度信息的红花图像;最后利用基于 Stable Diffusion 的风格迁移 VFM 将该图像风格转换为卡通图像。
在上述 pipeline 中,Prompt Manager 作为 ChatGPT 的调度器,提供可视化格式的类型并记录信息转换的过程。最后,当 Visual ChatGPT 从 Prompt Manager 获得卡通提示时,它将结束执行 pipeline 并显示最终结果。
系统架构
Visual ChatGPT 的系统架构如下所示:
左侧:具体的 Demo 示例
- 首先,上传图片(系统接收图片)
- 接着,继续提问
- Visual ChatGPT 根据提问的要求,给出相应的回答
借鉴/使用 Stable Diffusion 的扩散过程
不断询问是否使用视觉基础模型(Visual Foundation Models,VFM)
- 使用:不断进行扩散
- 不使用:扩散过程完成,输出最终的答案(符合要求的图片)
- 接着,继续提问
- ……
右侧:详细的 Token 说明与整合
将 System Principles(原理)、Visual Foundation Models、User Query(本次查询)、History of Dialogue(历史对话 -> ChatGPT 生成)、Prompt Manager(生成 Prompt)、History of Reasoning(历史推理 -> Stable Diffusion 生成)、Intermediate Answer(Stable Diffusion 本次扩散的生成结果)融合成一个 Token 整体
然后将这个 Token 整体送给 ChatGPT
再将 ChatGPT 得到的结果进行处理(是否使用 VFM)
Demo
所需 GPU 显存
Foundation Model | Memory Usage (MB) |
---|---|
ImageEditing | 6667 |
ImageCaption | 1755 |
T2I | 6677 |
canny2image | 5540 |
line2image | 6679 |
hed2image | 6679 |
scribble2image | 6679 |
pose2image | 6681 |
BLIPVQA | 2709 |
seg2image | 5540 |
depth2image | 6677 |
normal2image | 3974 |
InstructPix2Pix | 2795 |
参考:
Github:https://github.com/microsoft/visual-chatgpt
2023-03-09
GPT-4 即将下周推出?
在 2023 年 3 月 9 日举行的一场名为「AI in Focus - Digital Kickoff」的线下活动中,四名微软德国员工展示了 GPT 系列等大型语言模型(LLM)的颠覆性力量,以及 OpenAI 技术应用于 Azure 产品的详细信息。
在活动中,微软德国首席技术官 Andreas Braun 表示 GPT-4 即将发布,自从 3 月初多模态模型 Kosmos-1 发布以来,微软一直在测试和调整来自 OpenAI 的 多模态 模型。我们将在 **下周** 推出 GPT-4,它是一个多模态的模型,将提供完全不同的可能性——例如视频(生成能力),Braun 说道,他将语言大模型形容为游戏规则改变者,因为人们在这种方法之上让机器理解自然语言,机器就能以统计方式理解以前只能由人类阅读和理解的内容。
参考:
必应日活首次破亿
2023 年 3 月 9 日,必应的日活用户数在史上首次破亿。
毫无疑问,这完全是 ChatGPT 的功劳。整合进 ChatGPT 后,必应势如破竹。而谷歌的搜索引擎市场,正在被这个可怕的对手一点点蚕食。
参考:
2023-03-10
ChatGPT、GPT-3.5、DALL·E 2 正式加入 Azure
北美时间 2023 年 3 月 9 日,微软在官方博客宣布,ChatGPT 已被正式整合进 Azure Open AI 服务中,现在是预览版。
这意味着,企业和个人开发者现在都可以借助 Azure OpenAI 服务,用上最先进的 AI 模型,包括 Dall-E 2、GPT-3.5、Codex 等。
参考:
2023-03-11
2023-03-12
OpenChatKit:类 ChatGPT 的开源项目
2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。
ChatGPT 功能强大,但 OpenAI 不太可能将其开源。「其他」阵营表现欠佳,但不少人都在做开源方面的努力,比如 前段时间 Meta 开源的 LLaMA。
除此之外,一个名为 EleutherAI 的开源 AI 研究团队也一直在贡献开源大模型成果。自 2020 年 7 月成立以来,该团队先后开源了基于 GPT-3 的、包含 60 亿参数的 NLP 模型 GPT-J,类 GPT 的 27 亿参数模型 GPT-Neo,以及 200 亿参数的 GPT-NeoX-20B。据悉,他们的最终目标是将开源模型的参数规模扩展到 1700 亿左右,就像 GPT-3 一样。
在 ChatGPT 火遍全球之际,EleutherAI 的这些开源成果派上了用场。一家名为 Together 的组织表示,他们 基于 EleutherAI 开源的 GPT-Neo 和 GPT-J 构建了一个新的类 ChatGPT 开源项目——OpenChatKit。
这个项目提供了一个强大的、开源的基础,可以为各种应用创建专门和通用的聊天机器人。具体来说,它包含:
一个参数量达 20B 的开源模型,该模型基于 EleutherAI 的 GPT-NeoX-20B,在 4300 万条指令 (基于 OIG-43M 数据集)上进行了微调;
一个参数量达 60 亿的 审核模型(moderation model),可以帮模型过滤不当内容;
一个可扩展的 检索系统,可以帮模型检索维基百科等资源库,从而给出最新信息。
Open Instruction Generalist (OIG) 数据集中的一个例子如下所示:
参考:
2023-03-13
2023-03-14
2023-03-15
OpenAI 发布 GPT-4
GPT-4 -> NLP、CV 的 “终结”
2023-03-16
百度文心一言发布会
迈出第一步
2023-03-17
微软发布 Microsoft 365 Copilot
Copilot 的名称来源于 2021 年微软的 Code Copilot(Github Copilot) 工具
ChatGPT 融入 Microsoft Office 全家桶。
来源:IT之家:微软宣布推出 Microsoft 365 Copilot:AI 助力 Word、PowerPoint、Excel 生产力大提升
会聊天的汤姆猫:基于 ChatGPT
3 月 16 日消息,《会说话的汤姆猫》是很多年前比较流行的一款手机宠物类应用游戏,但随着时间的流失,这款游戏似乎已经失去了往日的光辉,不过借助于最近大火的 ChatGPT,《会说话的汤姆猫》已经升级为了《会聊天的汤姆猫》,并且今天开启了产品功能原型封闭式测试,仅针对安卓用户。
2023-03-21
Google 推出 Bard 测试版本
Google Blog:Try Bard and share your feedback
OpenAI 发表论文,讨论 ChatGPT 可能带来的社会影响
2023-03-22
- Google:Gemma、CodeGemma
360 开源:开源模型中最大的上下文【7B】
https://github.com/Qihoo360/360zhinao/
https://huggingface.co/qihoo360/360Zhinao-7B-Chat-360K
JetMoE:Reaching LLaMA2 Performance with 0.1M Dollars【8B】
https://github.com/myshell-ai/JetMoE
https://huggingface.co/jetmoe/jetmoe-8b
https://research.myshell.ai/jetmoe
Google:Mixture-of-Depths(MOD)
改变了以往 Transformer 的计算模式【可以实现 动态分配计算】
Mixture-of-Depths: Dynamically allocating compute in transformer-based language models
Google:Infini-Transformer
Infini-Transformer 引入了一种有效的方法,可以将基于 Transformer 的大型语言模型 (LLM) 扩展到无限长输入,而不增加内存和计算需求。
在有限的内存中,将 Transformer LLM 扩展到无限长的上下文
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention
多模态模型 Mini-Gemini【开源,香港中文大学】
识图、推理、生图 一站解决【融合 ChatGPT + DALLE·3】
Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models
Real-ESRGAN 是一个旨在开发实用的图像/视频恢复算法的项目。该项目主要功能、关键特性和核心优势包括:
提供动漫视频小模型和动漫插图模型
支持在线 Colab 演示和便携式 Windows/Linux/MacOS 可执行文件
实现了对真实世界盲目超分辨率训练,支持纯合成数据微调
集成了 GFPGAN 以支持面部增强功能
提供详细的训练指南,并发布了训练代码
中国电信:TeleChat 星辰语义大模型
github:https://github.com/Tele-AI/Telechat
TeleChat-1B(1.10)
TeleChat-12B(4.16)
Ollama
Ollama 是一个专为运行、创建和分享大型语言模型而设计的开源项目,为开发者和研究者提供了一个平台,使得他们可以更方便地 部署、管理和使用 这些大型语言模型。目前 Ollama 支持支持 macOS、Windows、Linux 和 Docker 等多种安装方式,还能通过 API 方式为本地 AI 服务提供便捷途径。
目前 Ollama 支持的模型如下图所示:
Llama 3
Llama-Chinese
- Github:Llama-Chinese
Idefics2
Huggingface 最强开源视觉模型
80 亿参数突破多模态关键技术
https://huggingface.co/HuggingFaceM4/idefics2-8b
Idefics2 已经在 HuggingFace 的
Transformers
库中集成,便于开发者进行后续的细分任务微调
Qwen1.5-110B
开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B
Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的 Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
Parler-TTS
Parler-TTS 是大名鼎鼎的 huggingface 推出的一款轻量级文本到语音(TTS)模型,它能够生成高质量、自然流畅的语音,并且能够模仿特定说话者的风格,包括性别、音高、说话风格等。
这款模型是由 Dan Lyth 和 Simon King 创建,他们分别来自 Stability AI 和爱丁堡大学,共同撰写了论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》。
这个模型即是这一论文的复现。
https://huggingface.co/parler-tts/parler_tts_mini_v0.1
文档信息
- 本文作者:Bookstall
- 本文链接:https://bookstall.github.io/2023/03/17/ChatGPT-news-list/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)