Thanks to visit codestin.com
Credit goes to github.com

Skip to content

miskolee/Rola

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

=====================================================================
== 项目名称:Rola
== 主要编程语言: PHP
== 创建人: Misko_Lee
== Email: [email protected]
== Sina Weibo:@misko_lee
== 创建时间:2012-12-01
== 当前版本:0.12
== 设计思路:
   首先将元模板解析成语法树,从DOM头部开始搜索匹配。

/********************************************************************
 **** RoLa是一个简单的元模板生成语言。
 **** 主要用于网络爬虫的特定爬取以及网页模板的快速生成
 **** 互联网搜索引擎是基于内容搜索,而RoLa是基于HTML的DOM结构,准确的
 **** 提取莫一部分特定的内容
 **** 本语言不单独使用,只是简单的描述了定义的DOM文档,具体的文档解析
 **** 请使用其他HTML解析工具,如 simple_html_dom 等非常优秀的工具
 **** simple_html_dom是rola的内部使用的DOM处理工具,如果需要使用其他
 **** 工具,需要修改kobe中的代码。未来版本将支持与DOM处理类完全分离

 *************************** 语法说明 ******************************
 ===================================================================
 ** 1.所有的标签使用<>包含
 ** 2.所有的属性使用健值对的方式包含在括号中,就算没有属性也必须使用
 **()作为占位符
 ** 3.多个属性使用&隔开
 ** 4.同级标签使用,分隔
 ** 5.子节点在标签内部直接包含
 ** 6.标签必须有结束符号>
 ** 7.不得使用空格
 ** 8.需要搜索的属性使用{}括号
 ** 下一个版本将支持内嵌正则表达式
 ===================================================================
 ** 语法例子:
 ** <div(id=nav&class=goods)>
 ** <div(id=nav&class=goods)<p()>,<a(href=http://www.*>
 ** (暂不支持,未来版本加入)
 ** <div(id=id)<a(){href%class}>>
 ===================================================================
 ** 使用例子暂无
 ** $partten="<div(id=id&class=class)>";
 ** $rola=new Rola($partten);
 ** $rola->slolver(); //调用解析器
 ** $rola->toTree(); //获取基于多叉树描述的DOM
 ********************************************************************/





About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published