CS229 Note Lecture 02

CS229 Note Lecture 02

Qiniu

Dropbox

Read more

CS229 Note Lecture 01

CS229 Note Lecture 01

Machine Learning Definition

Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.

Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and s[……]

Read more

Deploying Kcptun to Make Shadowsocks Great Again!

Deploying Kcptun to Make Shadowsocks Great Again!

Kcptun is a simple UDP Tunnel based on KCP which can speed up Shadowsocks significantly.

Server (Ubuntu 16.04)

  1. Download Kcptun Server from Github
  2. Edit configuration file ~/kcptun/config.json

    listen is your kcp server lis[……]

Read more

Deploy Shadowsocks-go on VPS

Deploy Shadowsocks-go on VPS

  1. Install the latest version of Go
  2. Setup GOPATH
  3. Edit the configuration file ~/shadowsocks-go/config.json

    Delete key “server” to enable IPv6
    Use the suffix -auth after chacha to enable[……]

Read more

朴素贝叶斯

朴素贝叶斯

  • 创建词汇表
    将文档中的新词集合添加到词汇表
  • 词集模型(set-of-words model)
    通过词汇表将文档转换为文档向量, 向量的每个元素表示词汇表中的单词在输入文档中是否出现
  • 词袋模型(bag-of-words model)
    文档向量的每个函数表示词汇表中的单词在文档中出现的次数
  • 使用正则表达式切分文本
    捕获所有单词, 去掉少于两个字母的字符[……]

Read more

使用k-临近算法识别手写数字

使用k-临近算法识别手写数字

k-临近算法

k-临近算法

k-临近算法

分类器

归一化

机器学习可用数据集

机器学习可用数据集

  • UCI Machine Learning Repository 最有名的机器学习数据资源来自美国加州大学欧文分校. 该数据库已经提供了 200 多个可用的数据集. 其中很多数据常被用来比较算法的性能, 基于这些资源, 研究人员可以得到相对客观的性能比较结果.
  • 大型公用数据集存储库 如果你是一个大数据的爱好者, 这个链接尤其不能做过. Amazon 拥有真正的大数据, 包括美国人口普查数据, 人类基因组注释的数据, 一个 150GB 的日志(维基百科的页面流量)和一个 500GB 的数据库(维基百科的链接数据).
  • Data.gov Data.gov 启动于 2009 年, 目[……]

Read more

%d 博主赞过: