「 SPARK 」
September 11, 2018
Words count
8.1k
Reading time
7 mins.
「 SPRING 」
September 05, 2018
Words count
4.3k
Reading time
4 mins.
平时项目里可能会遇到,在启动项目的时候,需要进行初始化操作,如执行一段SQL脚本,或者提前对一些类进行实例化。这时候可以使用ApplicationRunner接口进行操作。下面将从初始化执行SQL脚本为例,记录在项目中应用ApplicationRunner的方法。
在项目resources目录下存放我们将要初始化的sql脚本,内容如下:
create_table_sql.sql
-- 创建模型表
CREATE TABLE IF NOT EXISTS `model`(
`modelKey` VARCHAR...
Read article
「 SPARK 」
August 31, 2018
Words count
6.1k
Reading time
6 mins.
版本说明
kafka:2.12-2.0.0
spark:
<spark.version>2.3.0</spark.version>
scala依赖包:
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-streaming-kafka-0-10_2.11</artifactId>
<version>${spark...
Read article
「 SPARK 」
August 31, 2018
Words count
9.3k
Reading time
8 mins.
版本说明
Spark:2.3.1
Elasticsearch: elasticsearch-6.4.0
1.1 依赖包
1.1.1 Spark依赖
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-core_2.11</artifactId>
<version>${spark.version}</version>...
Read article
「 环境搭建 」
August 30, 2018
Words count
8.2k
Reading time
7 mins.
版本:zookeeper-3.4.13
1.1 准备三台机器
机器信息如下:
hostname |
ip |
端口 |
master.hadoop.com |
192.168.162.180 |
2181/2881/3881 |
slave1.hadoop.com |
192.168.162.181 |
2181/2881/3881 |
slave2.hadoop.com |
192.168.162.182 |
2181/2881/3881 |
按照上面信息分别修改hostname
vi /etc/hostname
并...
Read article
「 SPARK 」
August 28, 2018
Words count
16k
Reading time
15 mins.
RDD操作有两种:Transformation和Action
Transformation:从一个已有的RDD中创建一个新的RDD
Action:执行计算,返回一个结果
Transformation |
Meaning |
map(func) |
遍历已有的RDD中的每个元素,并应用func函数,生成新的RDD返回。 |
filter(func) |
应用func函数过滤已有RDD的每个元素,生成新的RDD返回。 |
flatMap(func) |
与map类似... |
Read article