
引入
以前当我们想获取<student> -> <name>  ->   <xing> -> "张"
时,我们需要先依次获取对应的标签。在获取内容
   我们希望有一种快捷的方式,一下子就能定位到这里。
   因此就有了快捷查询方式。
快捷查询方式
selector
选择器查询
  使用方法:Elements select(String cssQuery) 
selector语法
 参考selector中定义的语法
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
   | package com.xml.jsoup;
  import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements;
  import java.io.File;
 
 
 
 
 
  public class JsoupDemo5 {     public static void main(String[] args) throws Exception {                  String path = JsoupDemo2.class.getResource("student.xml").getPath();                  Document document = Jsoup.parse(new File(path), "utf-8");                  Elements elements = document.select("name");         System.out.println(elements);         System.out.println("---------------");                  Elements elements1 = document.select("#id01");         System.out.println(elements1);         System.out.println("---------------");                             Elements elements2 = document.select("student[number='xml_0001']");         System.out.println(elements2);         System.out.println("---------------");                    Elements elements3 = document.select("student[number='xml_0001']>age");         System.out.println(elements3);
 
      } }
   | 
 
XPath
 w3c定义的一种语法
 XPath即为XML路径语言(XML Path Language),
 它是一种用来确定XML文档中某部分位置的语言。
XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。
起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。
但是XPath很快的被开发者采用来当作小型查询语言。
使用Jsoup的XPath需要导入额外的jar包
JsoupXpath-0.3.2.jar
参考w3c的XPath语法文档来使用
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
   | package com.xml.jsoup;
  import cn.wanghaomiao.xpath.model.JXDocument; import cn.wanghaomiao.xpath.model.JXNode; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import java.io.File; import java.util.List;
 
 
 
 
 
  public class JsoupDemo6 {     public static void main(String[] args) throws Exception {                  String path = JsoupDemo2.class.getResource("student.xml").getPath();
                   Document document = Jsoup.parse(new File(path), "utf-8");                  JXDocument jxDocument = new JXDocument(document);
                   List<JXNode> jxNodes = jxDocument.selN("//student");         for (JXNode jxNode:jxNodes){         System.out.println(jxNode);         }         System.out.println("===================");                  List<JXNode> jxNodes2 = jxDocument.selN("//student/name");         for (JXNode jxNode:jxNodes2){             System.out.println(jxNode);         }         System.out.println("===================");
                   List<JXNode> jxNodes3 = jxDocument.selN("//student/name[@id]");         for (JXNode jxNode:jxNodes3){             System.out.println(jxNode);         }         System.out.println("===================");                  List<JXNode> jxNodes4 = jxDocument.selN("//student/name[@id='id01']");         for (JXNode jxNode:jxNodes4){             System.out.println(jxNode);         }         System.out.println("===================");
      } }
   |