5 个Python 库，照亮你的机器学习之路_国内资讯_智能设备_中国计算网——工业互联网一站式服务平台—

这些 Python 库帮助你加速数据传输，通过 AWS Lambda 对大型计算工作做碎片化处理，并使用略低于 TensorFlow 的模型工作。

机器学习令人兴奋，但具体工作复杂而困难。通常它涉及很多手动提升——汇总工作流及传输渠道，设置数据源，以及在内部部署和云部署的资源之间来回分流。

用来提高工作效率的手头工具越多越好。庆幸的是，Python 是一个威力巨大的工具语言，在大数据和机器学习之中被广泛使用。下面是 5 个 Python 库，帮助你缓解来自交易提升的重负。

PyWren

地址：https://github.com/ericmjonas/pywren

PyWren，一个带有强大前提的简单包，能使你运行基于 Python 的科学计算工作量，以作为 AWS Lambda 函数的多个例子。项目 At The New Stack 的简介这样描述 PyWren: 把 AWS Lambda 用作一个巨大的平行处理系统，以处理那些可被切割成诸多小任务的项目，这些小任务的运行不需要占用很多内存或硬盘。

Lambda 函数的一个缺点是运行时间最长不能超过 300 秒。但是，如果你需要一个只花费几分钟就能完成的工作，并在数据集中需要运行数千次，那么 PyWren 也许是一个好选择，它可以一种用户硬件上不可用的规模平行化云端的工作。

谷歌的 TensorFlow 框架正迈入伟大时刻，因为刚发布了 1.0。人们通常会问一个问题：如何利用在上面训练的模型而无需使用 TensorFlow 本身？

Tfdeploy

地址：https://github.com/riga/tfdeploy

Tfdeploy 可以部分解决这个问题。将训练过的 TensorFlow 模型输出「一个简单的基于 Numpy 的可调用对象（callable）」，也就是说，借由 Tfdeploy，可以在 Python 中使用模型，而且 Numpy 的数学和统计库被作为唯一的依靠。几乎所有能在 TensorFlow 上跑的运行也能在 Tfdeploy 上跑，而且你可以通过标准 Python 隐喻方式来延伸库的行为（比如，超载一个类别）。

1/2 1 2 下一页尾页