【产品简介】:百度飞桨 (PaddlePaddle) 是百度推出的开源深度学习平台,致力于为开发者提供全流程的 AI 开发能力,涵盖 AI 模型训练、开发、部署等全流程。飞桨平台提供了丰富的预训练模型库、开发套件和工具组件,并支持多种硬件平台,可以帮助开发者快速构建、训练和部署 AI 应用。
【基础能力】: 飞桨提供了丰富的API和工具,支持诸如神经网络、卷积网络、循环神经网络、自编码器等多种深度学习模型。此外,飞桨还具备高效的分布式训练能力,并支持多种硬件加速器,如GPU和TPU。
【场景机器人】: 主要场景包括Hackathon、学习提升、办公提效、生产创作、绘画达人、编程开发、产业精选、娱乐互动、生活帮手、视频制作。
【模型库】: 百度飞桨平台提供的多个模型,包括 PP-OCRv3 文字检测识别系统、PP-TTS 飞桨开源流式语音合成系统、ERNIE-UIE 信息抽取模型、文心大模型旗舰版、PP-ChatOCR、PP-YOLOE+_crn_l_80e 单阶段Anchor-free目标检测模型、通用OCR、have fun、PP-StructureV2文档分析系统、PP-ASR 飞桨开源语音识别系统、PP-Matting图像抠图模型以及文心大模型极速版等。
【操作流程】: 飞桨的操作流程通常包括数据准备、模型设计、训练、评估和部署等环节。用户可以通过飞桨提供的教程和文档学习如何进行这些操作。
【使用教程】:
第一步 登录控制台
首先您登录后将进入控制台概览。
在这里您可以看到平台的热门内容推荐,同时也可以通过“开发模型”和“开发应用”的快捷入口进入相应的开发流程。详细步骤说明可查看文档:模型开发 和 应用开发
通过右侧个人相关信息栏可快速掌握账户下各类资源权益消耗情况。
第二步 公开内容探索
通过顶部导航,您可以快速切换内容板块,探索浏览优质公开内容。具体包括项目大厅、应用中心、模型库、数据集大厅及课程、比赛大厅、活动中心等。
第三步 个人内容管理
通过左侧导航按钮切换,您可以对个人相关内容进行快速查看和管理。
切换至“我创作的”,您可以对您创作的项目、应用、模型、服务、工具、数据集、脚本任务、后台任务等内容容进行查看和管理。
通过左侧按钮切换至“社区活动”,您可以统一查看管理您参与的课程、比赛和活动等内容。
【常见问题】: 在使用飞桨的过程中,用户可能会遇到诸如环境配置、模型训练、参数调整等方面的问题。飞桨的官方文档和社区通常能提供相应的解答和支持。
【价格服务】:
探索版免费,创作版29.9元/月,次月续费限时优惠至49.9元/月
【用户反馈】: 用户对飞桨的反馈总体积极,认为其在深度学习领域具有较高的实用价值和竞争力。同时,用户也分享了自己在使用过程中的心得和经验。
【常见问题】:
Q:百度大脑目前开放了哪些能力?
A:百度大脑是百度 AI 核心技术引擎,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台。百度大脑对内支持百度所有业务,对外全方位开放,助力合作伙伴和开发者,加速AI技术落地应用,赋能各行各业转型升级,并赋能行业客户。
Q:每个服务的请求配额都是免费的么?
A:目前我们为每个账户下的每项API服务,都设置了固定的免费请求配额,便于您体验服务及应用调试。在免费试用阶段,成功调用或失败调用都算做一次有效调用,会消耗免费测试资源。
Q:每个服务的请求配额有限制么?
A:目前在同一账号下,您可以在对应服务的控制台中查看。付费服务不限请求数量,即用即扣。
Q:QPS超限怎么办?
A:QPS超限可以根据您的需求,进行购买。百度AI技术服务的详细价目表: https://ai.baidu.com/ai-doc/REFERENCE/hk3dwjfzo
价目表包含:免费测试资源、计费简介、计费价目表、费用列举等。
Q:支持哪些语言的服务端SDK?
A:目前支持各项服务的Java、PHP、Python、C#、Node.js版本服务端SDK,部分技术推出了C++、IOS、Android等版本服务端SDK,详情请参见各技术服务SDK文档。
Q:识别的图片支持怎样输入?
A:目前人脸识别接口支持base64编码和图片URL输入。
Q:识别的图片格式有什么要求?
A:支持PNG、JPG、JPEG、BMP等格式图片,暂不支持 GIF 类型的动图识别。
Q:人脸服务的请求图片大小限制是?
A:图片数据总数据大小需限制在10M内。
Q:人脸识别、认证我应该取多少分算是同一人?
A:推荐可判断为同一人的相似度分值为80,大概对应的误识率为万分之一,您也可以根据业务需求选择更合适的阈值。
Q:人脸识别和人脸认证,有什么区别?
A:人脸认证与人脸识别的差别在于:人脸识别需要指定一个待查找的人脸库中的组;而人脸认证需要指定具体的用户id即可,不需要指定具体的人脸库中的组;实际应用中,人脸认证需要用户或系统先输入id,这增加了验证安全度,但也增加了复杂度,具体使用哪个接口需要视您的业务场景判断。
Q: 文字识别的并发量上限是多少?
A: 大部分文字识别接口在未开通付费时提供2QPS额度,开通付费后提升至10QPS,如果您有更高并发需求,可购买QPS叠加包进行扩充。对于已上线但没有价格的产品,暂属于测试状态,当测试额度不足时,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的并发量。
Q:如何购买/提升调用次数?
A:已上线计费的接口,您可以直接在控制台购买次数包或开通按量后付费,计费价格参见产品价格;未上线计费的接口,您可以提交工单进行申请,您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的调用次数。
Q:文字识别对上传的图片格式、图片大小有哪些要求?
A:支持 JPG、JPEG、PNG、BMP、TIF、WebP 等格式图片,暂不支持 GIF 类型的动图识别。
一般情况下,图像base64编码后大小必须小于4M,建议不要超过1M;最小边长不小于15,最大边长不超过4096,建议不要超过1024(编码后大于1M或最大边长超过1024的图像会被等比压缩,建议控制输入图像大小,有助于减少网络传输及接口处理耗时)。但是不同的功能接口,对于图片大小的要求可能不同,具体以相应的API文档中的 Image 和 url 参数说明为准。
Q:图片格式和分辨率有限制吗?
A:目前图片格式支持PNG、JPG、JPEG、BMP、GIF(仅对首帧进行审核)、Webp、TIFF;图像要求base64后大于等于5KB,小于等于4MB,最短边大于等于128像素,小于等于4096像素。
Q:图片大小有限制吗?
A:图像URL地址,以URL形式请求,图像Url需要做UrlEncode,图像要求base64后大于等于5kb, 小于等于4M,最短边大于等于128像素,小于等于4096像素。
Q:识别的图片支持怎样输入?
A:支持传输Base64编码后的图片或者图片的URL。
【中文关键词】:百度飞桨, PaddlePaddle, 深度学习, 人工智能, AI, 模型训练, 模型部署, 预训练模型, 开发套件, 工具组件, 硬件支持, 自然语言处理, 计算机视觉, 语音识别, 推荐系统
【英文关键词】:Baidu PaddlePaddle, Deep Learning, Artificial Intelligence, AI, Model Training, Model Deployment, Pre-trained Models, Development Kits, Tool Components, Hardware Support, Natural Language Processing, Computer Vision, Speech Recognition, Recommendation System