Loading...

每日AI快讯

2025年05月13日 • 星期二
15:40

ChatGPT将SharePoint和OneDrive连接DeepResearch深入研究

现在可将Microsoft OneDrive或SharePoint文档库连接到ChatGPT Deep Research,这些连接的应用是第三方服务,受各自条款约束。连接后,ChatGPT能访问文件实时数据并实时分析,只需连接、提问,Deep Research就会读取、分析并引用相关内容。连接方式有两种,可在撰写器中操作,也能从ChatGPT设置里的连接应用进入。连接时,ChatGPT会从用户提示生成搜索查询并发送给微软。微软365管理员可按相关说明为组织批准OAuth应用。

来源:AI怪
15:23

Anthropic 在 API 中发布了联网搜索功能

该功能允许网络开发者构建支持联网搜索的AI,以获取最新信息并提供有据支撑的答案及相关引用的应用程序,目测对接Claude API也能够联网搜索了。

来源:AI怪 [原文链接]
12:02

Meta 发布了两个新模型:感知语言模型+定位3D模型

Meta推出感知语言模型(PLM)和定位3D(Locate3D)两项新技术。PLM采用视觉编码器与LLaMA 3解码器模块化架构,支持图像、视频及文档多模态任务,通过三阶段训练提升细粒度视觉理解与时空推理能力,在视频字幕生成等40+基准测试中性能提升39.8%。Locate3D基于3D-JEPA自监督算法,可直接处理RGB-D传感器数据,实现开放词汇3D物体定位,定位精度达61.7%,抓取成功率80%,适用于机器人、工业自动化及AR场景。两项技术均开源,PLM提供多模态基准测试,Locate3D发布大规模标注数据集,推动AI从环境感知向环境理解与操控演进,助力机器人、AR/VR等领域的技术发展。

来源:AI怪 [原文链接]
10:47

Manus开放注册,无需邀请码,送1000 积分 + 300 每日积分

Manus正式结束内测阶段的邀请码制度,全面开放注册。此前,由于内测资格稀缺,Manus的邀请码在二手交易平台曾被炒至数万元。这一开放标志着Manus从早期技术验证迈向规模化应用,用户无需再通过复杂申请流程即可直接体验其功能。官方表示,此举旨在加速AI代理技术的普及,并推动更多行业场景的落地。

  • 所有用户均可使用,无需排队
  • 所有用户每天一个免费任务(300 积分)

所有用户均可获得一次性 1000 积分奖励 价值更高,更灵活。立即登录 Manus 并探索!

 

来源:AI怪
2025年05月12日 • 星期一
19:23

一年半融资七轮超10亿!自变量机器人再获美团数亿元A轮加码

成立一年半的自变量机器人完成数亿元A轮融资,由美团领投。此前,该公司已完成多轮融资,总额超10亿元。自变量机器人专注于通用具身智能大模型研发,旨在构建具备精细操作能力的通用机器人,并已推出WALL-A操作大模型。公司还构建了数据闭环体系和自主研发的机器人本体,已在复杂任务场景中应用。

19:07

我深度体验了 Cursor 0.5:重构计费模式与 AI 协作革命如何重塑开发效率?

Cursor 0.5版本通过双模式计费体系(固定请求/Token消耗)和Background Agent异步协作引擎重构开发效率。新增容器化执行环境支持远程任务处理,提升70%本地资源利用率;多任务并发处理缩短重构时间至12分钟,准确率可达89%。智能上下文管理实现12万行代码秒级加载,search & replace工具提升跨文件编辑效率4倍。用户体验优化包括0.5秒文件定位和操作效率提升25%。社区反馈显示其显著缩短开发周期,但大型项目存在逻辑误差需优化,官方文档需同步更新。未来将扩展多模态模型支持,开发一键回滚和企业协作功能,推动AI工具向核心生产力转型。

来源:AI怪 [原文链接]
18:47

ChatGPT 放大招!GitHub 代码分析功能深度揭秘,开发者直呼真香

ChatGPT新增GitHub代码分析功能,通过OAuth授权接入代码库,利用NLP与RAG技术实现代码结构解析、文档生成及问题诊断。核心价值包括提升代码理解效率、优化团队协作、增强分析准确性。支持仓库级搜索与跨文件整合,但暂不支持精准文件定位。开发者反馈显示其在项目架构审查和文档生成上效果显著,但代码生成实用性较低。对比GitHub Copilot,侧重宏观分析而非实时补全。未来将支持文件名搜索及多工具联动,需解决数据隐私与合规问题。该功能标志着AI从辅助编码向全流程开发管理延伸。

来源:AI怪 [原文链接]
17:26

苹果发布FastVLM模型:用iPhone运行视觉语言处理,重新定义多模态AI边界

在人工智能技术持续突破的2025年,苹果公司再次以创新姿态引领行业——其研究团队于5月7日正式发布FastVLM视觉语言模型,通过革命性的FastViTHD架构,实现了85倍视觉编码速度飞跃和7.9倍首token生成加速。这一突破不仅刷新了视觉语言模型的效率纪录,更标志着苹果在端侧AI部署和跨模态技术整合上迈出关键一步。 一、技术突破:从架构革新到端侧部署 FastVLM的核心竞争力源于三大技术创新: 动态特征处理架构 FastViTHD采用混合维度处理策略,通过实时调整特征图分辨率(如动态切换384x384至11...

来源:AI怪 [原文链接]
2025年05月11日 • 星期日
14:40

Gemini 2.5 Pro 视频理解测试结果惊艳:多项任务领先,部分超越人类

近日,Gemini 2.5 Pro(05 - 06)在视频理解领域的测试结果引发关注,其表现堪称独树一帜,在多数视频理解任务上达到了领先水平(SOTA),甚至在一些测试集中超越了人类表现。正如 Logan Kilpatrick 所言:“Gemini 2.5 Pro (05 - 06) is SOTA at most video understanding tasks (by a large margin) 📽️. Lots of work by the Gemini multimodal team to make ...

来源:AI怪 [原文链接]
2025年05月10日 • 星期六
02:46

今日AI快讯:2025年5月9日AI行业热点新闻汇总

MCP协议标准化成为全球大厂布局核心,OpenAI、阿里、字节等加速整合工具链,推动AI服务互联互通;技术突破频现,百度“动物语言转换”多模态技术、华为L4自动驾驶网络及量子计算融合AI引发关注;开源生态爆发,Meta Llama 4.0、阿里通义千问3.0等模型竞相迭代,覆盖复杂推理与多语言场景;大厂动态中,OpenAI扩展海外算力、微软升级Copilot、英伟达推中国特供芯片最受瞩目;应用端在制造、医疗、金融等领域深化落地,开发者可享阿里云SSL证书优惠、百度API免费试用等福利。 1. M...

来源:AI怪 [原文链接]

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...

Generated Poster
海报生成中...