「大数据」(八十六)Scala基础
【导读:数据是二十一世纪的石油,蕴含巨大价值,这是·情报通·大数据技术系列第[86]篇文章,欢迎阅读和收藏】
1 基本概念
Scala 是基于 Java 虚拟机即 JVM 的一门编程语言。所有 Scala 的代码,都需要经过编译为字节码,然后交由 Java 虚拟机来运行。Scala 可以任意调用 Java 的代码, Scala 源代码被编译成 Java 字节码,并可以调用现有的 Java 类库。
2 术语解释
Scala 是一门多范式( multi-paradigm )的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。
3 Scala 特性
面向对象特性
Scala 是一种纯面向对象的语言,每个值都是对象。对象的数据类型以及行为由类和特质描述。
类抽象机制的扩展有两种途径:一种途径是子类继承,另一种途径是灵活的混入机制。这两种途径能避免多重继承的种种问题
函数式编程
Scala 也是一种函数式语言,其函数也能当成值来使用。
更进一步,程序员可以利用 Scala 的模式匹配,编写类似正则表达式的代码处理 XML 数据。
静态类型
Scala 具备类型系统,通过编译时检查,保证代码的安全性和一致性。类型系统具体支持以下特性:
(1) 泛型类
(2) 协变和逆变
(3) 标注
(4) 类型参数的上下限约束
(5) 把类别和抽象类型作为对象成员
(6) 复合类型
(7) 引用自己时显式指定类型
(8) 视图
(9) 多态方法
扩展性
Scala 的设计秉承一项事实,即在实践中,某个领域特定的应用程序开发往往需要特定于该领域的语言扩展。Scala 提供了许多独特的语言机制,可以以库的形式轻易无缝添加新的语言结构:
(1) 任何方法可用作前缀或后缀操作符
(2) 可以根据预期类型自动构造闭包。
并发性
Scala 使用 Actor 作为其并发模型, Actor 是类似线程的实体,通过邮箱发收消息。Actor 可以复用线程,因此可以在程序中可以使用数百万个 Actor, 而线程只能创建数千个。在 2.10 之后的版本中,使用 Akka 作为其默认 Actor 实现。
4 为什么要学Scala
1、优雅:这是框架设计师第一个要考虑的问题,框架的用户是应用开发程序员,API是否优雅直接影响用户体验。
2、速度快:Scala语言表达能力强,一行代码抵得上Java多行,开发速度快;Scala是静态编译的,所以和JRuby,Groovy比起来速度会快很多。
3、能融合到Hadoop生态圈:Hadoop现在是大数据事实标准,Spark并不是要取代Hadoop,而是要完善Hadoop生态。JVM语言大部分可能会想到Java,但Java做出来的API太丑,或者想实现一个优雅的API太费劲。