什么是多进程?
pandas介绍
概述
1 什么叫海量数据处理?
进程
Yarn和ZooKeeper没联系。Yarn配置的是ResourceManage资源管理;ZooKeeper是一个分布式的、开放源码的分布式应用程序协调服务;它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。
自从几年前开始在 GitHub 玩耍,接触到 Markdown 之后,就一发不可收拾,在各种文档编辑上,有条件用 Markdown 的尽量用,不能用的创造条件也要用——README、博客、公众号、接口文档等等全都是,比如当前这篇文章就是用 Markdown 编辑而成。
文本相似度计算/文本匹配
文本分类:传统机器学习模型和深度学习模型
实现了谱聚类的算法。
数据集
This repo contains the source code in my personal column (https://zhuanlan.zhihu.com/zhaoyeyu), implemented using Python 3.6. Including Natural Language Processing and Computer Vision projects, such as text generation, machine translation, deep convolution GAN and other actual combat code.