AMBARI二次开发 August 20, 2018

Ambari多语言处理

Words count 31k Reading time 28 mins.

在ambari-web/app下新建目录locales,然后在locales目录下创建zh、en目录,分别存放中文、英文语言js文件。

en下的message.js为英文语言,跟app目录下的message.js相同

zh下的使我们要汉化的语言。翻译相对应的字段即可。

1.1状态修改

修改modes/host_component.js 243行

    getTextStatus: function (value) {
        switch (value) {
            case this.installing...
Read article

AMBARI二次开发 August 20, 2018

Ambari二次开发-实时编译-部署 集成环境搭建

Words count 12k Reading time 11 mins.

总体思路:对ambari-web、ambari-admin进行单独编译,利用brunch watch功能,对文件源码进行实时监控编译。ambari-web/public 里存放编译完成的文件,(这里的文件目录与部署ambari后 /usr/lib/ambari-server/web 里的相同),对/usr/lib/ambari-server/web 建立软链接到public,就能实现 开发-编译-web可视化 的功能。

开发人员只需走的流程:

1. 本地访问samba共享目录里的源码进行二次开发
...
Read article

机器学习 August 19, 2018

1-1 numpy数组合并

Words count 5.2k Reading time 5 mins.

import numpy as np
x = np.array([1,2,3])
y = np.array([3,2,1])
x
array([1, 2, 3])
y
array([3, 2, 1])

x与y合并

np.concatenate([x,y])
array([1, 2, 3, 3, 2, 1])
z = np.array([666,666,666])
np.concatenate([x,y,z])
array([  1,   2,   3,   3,   2,   1, 666, 666...
Read article

机器学习 August 19, 2018

1-3 numpy中的矩阵聚合操作

Words count 8k Reading time 7 mins.

import numpy as np
L = np.random.random(100)
L
array([0.25119175, 0.92977429, 0.99646455, 0.01350068, 0.10785383,
       0.13216408, 0.53743682, 0.2362282 , 0.43276904, 0.88723033,
       0.32363798, 0.7736106 , 0.30140572, 0.70171898, 0.23628926,
       0.11465989, 0....
Read article

机器学习 August 19, 2018

1-4 numpy中Fancy Indexing

Words count 4.5k Reading time 4 mins.

import numpy as np
x = np.arange(16)
x
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15])
x[3]
3
x[3:9]
array([3, 4, 5, 6, 7, 8])
x[3:9:2]
array([3, 5, 7])
[x[3],x[5],x[8]]
[3, 5, 8]
ind = [3,5,8]
x[ind]
array([3, 5, 8])
ind...
Read article

机器学习 August 19, 2018

1-2 numpy.array中的运算

Words count 10k Reading time 9 mins.

import numpy as np

给定一个向量,让向量中每一个数乘以2
a = (0,1,2)
a*2 = (0,2,4)

普通python中

n = 10
L = [i for i in range(n)]
L
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
2 * L
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
A = []
for e in L:
    A.append(2*e)
A
[...
Read article

机器学习 August 19, 2018

2-6 k近邻算法总结

Words count 202 Reading time 1 mins.

最大的缺点:效率低下

如果训练集有m个样本,n个特征,则预测每一个新的数据,需要O(m*n)

优化,使用树结构:KD-Tree,Ball-Tree

缺点2:高度数据相关

缺点3:预测结果不具有可解释性

缺点4:维数灾难

随着维护的增加,“看似相近”的两个点之间的距离越来越大

解决方法:降维

Read article

机器学习 August 19, 2018

5-3 MNIST数据集

Words count 3.2k Reading time 3 mins.

import numpy as np
from sklearn.datasets import fetch_mldata
mnist = fetch_mldata("MNIST original",data_home="/Users/shirukai/Desktop/MachineLearn/datasets/")
mnist
{'COL_NAMES': ['label', 'data'],
 ...
Read article
Load more
0%