amy_888 发表于 2015-8-1 10:23:28

Apache Spark技术实战之2

  欢迎转载,转载请注明出处,徽沪一郎

概要
  通过一个简明的Demo程序来说明如何使用scala中的PackratParsers

DemoApp

import scala.util.parsing.combinator.PackratParsers
import scala.util.parsing.combinator.syntactical._
object Dotter extends StandardTokenParsers with PackratParsers {
    //定义分割符
lexical.delimiters ++= List(".",";","+","-","*")
    //合法的输入模式,支持加,减,乘
lazy val pgm : PackratParser = expr | minus|multiply
    //定义模式加
lazy val expr :PackratParser= num~"+"~num ^^ {case n1~"+"~n2 => n1.toInt + n2.toInt}
    //定义模式减
lazy val minus :PackratParser= num~"-"~num ^^ {case n1~"-"~n2 => n1.toInt - n2.toInt}
lazy val multiply :PackratParser= num~"*"~num ^^ {case n1~"*"~n2 => n1.toInt * n2.toInt}
lazy val num = numericLit
def parse(input: String) =
phrase(pgm)(new PackratReader(new lexical.Scanner(input))) match {
case Success(result, _) => println("Success!"); println(result);Some(result)
case n @ _ => println(n);println("bla"); None
}
def main(args: Array) {
      //定义list,::表示添加,Nil表示list结束
val prg = "12*2"::"24-4"::"3+5"::Nil
prg.map(parse)
}
}

parser中的表达式说明




AB 只保留B


^^
根据匹配结果生成语法短语


^^^
将语法短语转换成为另外的值,注意与^^的区别


~
连接符 A ̃B 表示模式匹配是B紧跟于A之后


|
或者 A|B 表示模式要么由A组成,要么由B组成


  

编译执行
  将上述源码保存到文件dotter.scala。

编译

scalac dotter.scala

执行

scala -cp . Dotter
页: [1]
查看完整版本: Apache Spark技术实战之2