java 并发包简称 JUC
给Java工程师的Scala入门教程
map vs foreach
- map: 逐行计算,返回一个新的集合
- foreach: 逐行计算,无返回结果
入门教程
scala隐式转换
future
https://docs.scala-lang.org/zh-cn/overviews/core/futures.html
future 组合
map: 将 前一个Future的成功执行的结果 应用到 f函数后,重新生成一个新的Future对象
flatMap
标签和索引的转化
环境配置
SparkStreaming优秀博客
spark 相关工程介绍
机器学习相关项目
- github.com/jpmml/sklearn2pmml
- github.com/combust/mleap
jpmml-spark
项目地址: https://github.com/jpmml/jpmml-sparkml
项目特点:
相关博客:
Converting Apache Spark ML pipeline models to PMML documents
MLEAP
项目地址: https://github.com/combust/mleap
项目特点:
MLeap is a common serialization format and execution engine for machine learning pipelines.
It supports Spark, Scikit-learn and Tensorflow for training pipelines and exporting them to an MLeap Bundle.
Serialized pipelines (bundles) can be deserialized back into Spark for batch-mode scoring or the MLeap runtime to power realtime API services.
标榜: transform 耗时比传统的spark少1000倍以上。
相关博客:
- Linear Regression: 0.0062 milliseconds with mleap vs 106 milliseconds with Spark LocalRelation
- Random Forest: 0.0068 milliseconds with mleap vs 101 milliseconds with Spark LocalRelation
spark_streaming
由于 spark_streaming 是基于时间窗口进行的微批处理,
在本地运行 spark-web
mock几个关键类
本文用于记录 使用 mock时,遇到的几个重要的 java 类或者注解
java安全简单入门
Policy文件、安全管理器 SecurityManager、存取控制器AccessController
request的获取
我们在编写代码的时候,有时候需要获取当前线程的request变量。本文简单介绍下,我目前已知的方式。