-
Notifications
You must be signed in to change notification settings - Fork 3
miskolee/Rola
Folders and files
| Name | Name | Last commit message | Last commit date | |
|---|---|---|---|---|
Repository files navigation
===================================================================== == 项目名称:Rola == 主要编程语言: PHP == 创建人: Misko_Lee == Email: [email protected] == Sina Weibo:@misko_lee == 创建时间:2012-12-01 == 当前版本:0.12 == 设计思路: 首先将元模板解析成语法树,从DOM头部开始搜索匹配。 /******************************************************************** **** RoLa是一个简单的元模板生成语言。 **** 主要用于网络爬虫的特定爬取以及网页模板的快速生成 **** 互联网搜索引擎是基于内容搜索,而RoLa是基于HTML的DOM结构,准确的 **** 提取莫一部分特定的内容 **** 本语言不单独使用,只是简单的描述了定义的DOM文档,具体的文档解析 **** 请使用其他HTML解析工具,如 simple_html_dom 等非常优秀的工具 **** simple_html_dom是rola的内部使用的DOM处理工具,如果需要使用其他 **** 工具,需要修改kobe中的代码。未来版本将支持与DOM处理类完全分离 *************************** 语法说明 ****************************** =================================================================== ** 1.所有的标签使用<>包含 ** 2.所有的属性使用健值对的方式包含在括号中,就算没有属性也必须使用 **()作为占位符 ** 3.多个属性使用&隔开 ** 4.同级标签使用,分隔 ** 5.子节点在标签内部直接包含 ** 6.标签必须有结束符号> ** 7.不得使用空格 ** 8.需要搜索的属性使用{}括号 ** 下一个版本将支持内嵌正则表达式 =================================================================== ** 语法例子: ** <div(id=nav&class=goods)> ** <div(id=nav&class=goods)<p()>,<a(href=http://www.*> ** (暂不支持,未来版本加入) ** <div(id=id)<a(){href%class}>> =================================================================== ** 使用例子暂无 ** $partten="<div(id=id&class=class)>"; ** $rola=new Rola($partten); ** $rola->slolver(); //调用解析器 ** $rola->toTree(); //获取基于多叉树描述的DOM ********************************************************************/
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published