CV、NLP、机器学习最新开源项目Top12!一应俱全

AI科技大本营 2018-10-15 12:02
关注文章

【导读】作者整理了近期最新发布及更新的 12 个非常有学习和收藏意义的开源项目。这些项目中包括基于 TensorFlow 的强化学习框架;可以对数据进行结构化处理的 AutoML 库;支持 TensorFlow,PyTorch,MXNet,CNTK 和 Caffe2 等多种深度学习框架的模型部署框架;可以帮助用户分析训练模型的工具;强大的人脸标记开源项目等等,可以说每一个项目都值得我们了解一下!接下来,我们就一起找到你喜欢的那一个,码起来!


1.Dopamine


基于 TensorFlow 的强化学习框架,Dopamine 是一个能够快速实现强化学习算法原型的研究框架,旨在为研究人员提供一个易于使用的实验室环境,并满足对小型、易于访问的代码库的需求。有了这个框架,你可以在研究过程中轻松地建立实验过程来验证你自己的想法。


GitHub 地址:https://github.com/google/dopamine



2.TransmogrifAI


TransmogrifAI 是一个用 Scala 编写的端到端的 AutoML 库,由 Salesforce 提供的开源项目。它能够在 Spark 运行,对数据进行结构化处理,旨在通过自动化机器学习技术,帮助开发者加速产品化过程。它仅需少量的代码,就能实现数据清理、特征工程和模型自动化过程,然后训练高性能的模型并将其应用于下一步的迭代和探索研究。


GitHub 地址:https://github.com/salesforce/TransmogrifAI



3.OpenNRE


OpenNRE 是基于 Tensorflow 开发的,一个用于神经网络关系提取的工具包,由清华大学刘知远老师及其团队贡献的开源项目。在该项目中,关系提取会分为嵌入、编码器、选择器和分类器四步。


Github 地址:https://github.com/thunlp/OpenNRE



4. TensorFlow Model Analysis


TFMA 是由 Google 发布的,一个 TensorFlow 模型分析的开源项目,旨在帮助 TensorFlow 用户分析训练好的模型。用户可以使用 Trainer 中定义的指标,以分布式的方式来评估大量数据的模型。此外,根据不同的数据计算指标,用户还可以将结果在 Juputer Notebooks 中进行可视化。


GitHub 地址:https://github.com/tensorflow/model-analysis



5. GraphPipe


graphPipe 是一个通用的深度学习模型部署框架,是由 Oracle 提供的开源项目。它旨在帮助用户简化机器学习模型的部署,并使用户摆脱特定框架的模型实现。此外,graphPine 还提供跨深度学习框架模型的通用API,开箱即用的部署解决方案和强大的性能。它支持 TensorFlow,PyTorch,MXNet,CNTK 和 Caffe2 等多种深度学习框架。








Github 地址:https://github.com/oracle/graphpipe


6. ONNX Model Zoo


这是一个通用的深度学习预训练模型集。该项目汇集了目前最好的深度学习预训练模型,这些模型全部由 Facebook 和 Microsoft 提供,以 ONNX (开放式神经网络交换) 的格式推出,并允许模型在不同框架之间进行迁移。每个模型都有一个相应的 Jupyter Notebook,其中包含模型训练,操作推理,数据集和参考等信息。


Github 地址:https://github.com/onnx/models



7 基于深度学习的人脸标定算法 (106 个人脸关键点)


这是一个强大的人脸标定的开源项目,包括面部美容,美容化妆,Crycocelle vivo 检测和人脸标定等预处理步骤。这个项目是基于传统的 SDM 算法,可在 Windows 平台上运行,并通过修改开源代码来简化部分测试代码及优化代码结构。基于深度学习技术,该项目设计了一种强鲁邦性的、并支持多面部追踪的高效网络模型。当前,深度学习算法在人脸标定领域取得了良好的效果,而该项目旨在提供一种相对简单易用的实现方法。


该项目主要有如下几大特点:


  • 我们使用 106 个人脸关键点,使得面部轮廓描述更加细腻。

  • 高准确率,即使在逆光和暗光条件下也可以获得良好的校准结果。

  • 模型小。追踪模型大约为2 MB,这非常易于在移动端实现模型集成。

  • 速度快。项目代码在 Qualcomm 820 (st) 上,单个人脸标定只需要7毫秒。

  • 增加多面部追踪功能。


Github 地址:https://github.com/zeusees/HyperLandmark




8. MagNet


MagNet 是一个基于 Pytorch 的深度学习高级 API,旨在位开发者减少模板的代码量,并优化深度学习项目开发的效率。





Github 地址:https://github.com/MagNet-DL/magnet



9. NLP.js


NLP.js 是一个基于 Node.js 的自然语言处理工具包。目前,它能够支持一系列的自然语言处理任务,包括单词分割,词干提取,句子分析,命名实体识别,文本分类和文本生成等任务。


Github 地址:https://github.com/axa-group/nlp.js



10. Texar


Texar 是一个基于 Tensorflow 的文本生成工具包,它能够支持诸如机器翻译,对话系统,文本总结和语言模型等任务,并允许研究者和开发者快速构建实验协议。


Github 地址:https://github.com/asyml/texar




11. Evolute


Evolute 是一个易于使用的进化算法框架。它定义了个体和种群等基础的结构,还能实现一些常见的进化算法操作,如选择,重现,突变和更新等。


Github 地址:https://github.com/csxeba/evolute



12. Task-Oriented Dialogue Dataset Survey


这是一种由任务驱动的对话数据收集项目,它能够将多种特定的、由任务驱动的对话系统数据汇集在一起,如 Dialogue bAbl, Stanford Dialog,Consonant data,DSTC-2,CamRest676 和 DSTC4 等系统。


Github 地址:https://github.com/AtmaHou/Task-Oriented-Dialogue-Dataset-Survey


原文链接:https://www.tutorialdocs.com/article/12-ai-open-source-projects.html

译者 | 林椿眄、Jane

责编 | Jane

出品 | AI科技大本营



微信扫一扫
关注该公众号

文章被以下专辑收录
{{panelTitle}}
支持Markdown和数学公式,公式格式:\\(...\\)或\\[...\\]

还没有内容

关注微信公众号