首页 文章
  • 1 votes
     answers
     views

    c#win8 HtmlAgilityPack麻烦

    您好我想从一个网站解析地铁应用程序的HTML . 我看了一些关于HtmlAgilityPack的教程,我觉得它很容易 . 但是当我开始项目时,我看到HtmlAgilityPack库中没有包含一些方法或引用作为我观看的教程 . 示例: 在教程视频中,它说: HtmlWeb web = new HtmlWeb(); HtmlDocument doc = web.Load(“url”); 在我的Ht...
  • 1 votes
     answers
     views

    HtmlAgilityPack下载通过javascript异步加载的网页

    我正在使用HtmlAgilityPack并尝试加载一些网页 . 一些网页是基于JavaScript的,并且异步加载 . 是否有任何方法可以在x秒后或确保页面完全加载后加载网页
  • 0 votes
     answers
     views

    如何在Div htmlagilitypack中获取Div

    首先..抱歉我的英语不好 我的问题是如何在htmlagilitypack c#中刮取div里面的div# 这是测试HTML代码 <html> <div class="all_ads"> <div class="ads__item"> <div class="test"&...
  • 12 votes
     answers
     views

    使用HtmlAgilityPack仅选择特定DIV中的项目

    我正在尝试使用HtmlAgilityPack从包含在声明为 <div class='content'> 的div中的页面中提取所有链接 . 但是,当我使用下面的代码时,我只需在整个页面上获取所有链接 . 这并不像每次调用SelectNodes时都会返回到根节点 . 我使用的代码如下: HtmlWeb hw = new HtmlWeb(); HtmlDocument doc = hw.L...
  • 0 votes
     answers
     views

    HtmlAgilityPack HtmlNode如何获取<select>和<option>标签

    我正在使用HtmlAgilityPack HtmlNode,我想得到 &lt;select&gt; and &lt;option&gt; and all other html tags. 目前HtmlNode只解析html,table,div,...标签 . 我怎样才能获得选项并选择标签 . 我目前的代码: if (htmlContent != null) { doc.LoadHtml(...
  • 2 votes
     answers
     views

    循环通过HtmlAgilityPack创建的节点

    我需要使用HtmlAgilityPack和C#解析这个html代码 . 我可以得到div class =“patent_bibdata”节点,但我不知道如何通过子节点循环 . 在这个样本中有6个hrefs,但我需要将它们分成两组;发明人,分类 . 我对最后两个不感兴趣 . 此div中可以有任意数量的href . 正如您所看到的,在两组之前有一个文本说明了什么是hrefs . 代码段 HtmlWeb...
  • 0 votes
     answers
     views

    如何通过属性在Perticular section / div中通过htmlagilitypack选择[复制]

    这个问题在这里已有答案: Selecting attribute values with html Agility Pack 6个答案 所以我在服务器端使用Htmlagilitypack来解析C#中的html . 这是一个问题..我有2个div元素 &lt;div&gt; &lt;a data-clear=&quot;movies-something&quot;&gt;&lt;/a&gt; &...
  • 13 votes
     answers
     views

    在HtmlAgilityPack中运行脚本

    我正在尝试抓取一个如下工作的特定网页 . 首先加载页面,然后它运行某种javascript来获取填充页面所需的数据 . 我对这些数据很感兴趣 . 如果我使用HtmlAgilityPack获取页面 - 脚本没有运行,所以我得到它本质上是一个空白页面 . 有没有办法强制它运行脚本,所以我可以获取数据?
  • 2 votes
     answers
     views

    XPATH查询,HtmlAgilityPack和提取文本

    我一直试图从名为“tim_new”的类中提取链接 . 我也得到了一个解决方案 . 解决方案,摘要和必要信息都给出了here 上面说的XPATH查询是 &quot;//a[@class='tim_new'] ,我的问题是,这个查询如何区分片段的第一行(在上面的链接和片段的第二行中给出) . 更具体地说,这个XPATH查询的字面翻译(英文)是什么 . 此外,我想写几行代码来提取针对 NSE: 的文本...
  • -1 votes
     answers
     views

    Gzip,HTMLAgilitypack

    我在HTMLAgillityPack错误中遇到Gzip的一些问题 - 'gzip'不是受支持的编码名称 码: var url = &quot;http://poe.trade/search/arokazugetohar&quot;; var web = new HtmlWeb(); var htmldoc = web.Load(url);
  • 0 votes
     answers
     views

    ASP.NET Core HtmlAgilityPack编码错误

    有一些关于编码问题的帖子和 HtmlAgilityPack 但是这个问题没有得到解决: 因为我尝试解析的网站包含像 € 或 ä 这样的Unicode符号, ü 我尝试将编码设置为Unicode: public class WebpageDeserializer { public WebpageDeserializer() {} /* * Example address:...
  • 0 votes
     answers
     views

    (不可能)在Unity中找不到HtmlAgilityPack

    我有HtmlAgilityPack的问题...我已经在Visual Studio中正确导入了包(参考&gt;管理NuGet包&gt;浏览,只是安装了包)在Unity中我收到此错误: Assets / Scripts / Searcher.cs(13,7):错误CS0246:找不到类型或命名空间名称'HtmlAgilityPack' . 你错过了装配参考吗? 我没有忘记在我的脚本中添加两个 us...
  • 36 votes
     answers
     views

    HtmlAgilityPack选择childNodes不符合预期

    我试图使用HtmlAgilityPack库来解析页面中的一些链接,但我没有看到我期望从这些方法得到的结果 . 在下面我有一个HtmlNodeCollection的链接 . 对于每个链接,我想检查是否有图像节点,然后解析其属性,但linkNode的SelectNodes和SelectSingleNode方法似乎在搜索父文档而不是linkNode的childNodes给出了什么? HtmlDocume...
  • 1 votes
     answers
     views

    HtmlAgilityPack:Descendants vs Xpath

    我正在使用HtmlAgilityPack lib,并从我有限的xpath知识中了解一些问题 . 如下面的代码示例所示,从即时窗口,table是从DocumentNode中选择的htmlnode . 因此,如果选择“/ div”,则选择“div”,选择“div”,“// div”选择文档中的所有div(因此它不会仅找到它的后代 . 因此我选择了table.Descendants相反,它给了我想要的5...
  • 1 votes
     answers
     views

    HtmlAgilityPack - SelectNodes在一种情况下返回节点,在另一种情况下返回null(对于相同的html)?

    我有一个非常简单的html页面,看起来像这样: (index.html的): &lt;html&gt; &lt;head&gt; &lt;title&gt;Test&lt;/title&gt; &lt;/head&gt; &lt;body bgcolor=&quot;white&quot; text=&quot;black&quot;&gt; &lt;center&gt;&lt;h1&gt;Tes...
  • 0 votes
     answers
     views

    HtmlAgilityPack - 使用c#解析带有cookie /标签的网站

    当我想从网页获取数据时,我通常使用带有HtmlDocument对象的HtmlAgilityPack,该对象使用网站的主网址,然后使用主表的HtmlNode对象,例如我想从页面获取的所有数据并复制它的XPath进入输入 . 例: HtmlDocument hDocument = GetHtmlDocumentFromUrl(&quot;http://someweb.com&quot;); HtmlN...
  • 4 votes
     answers
     views

    XPath在浏览器和HtmlAgilityPack中给出不同的结果

    我试图在C#程序中使用HtmlAgilityPack解析网页的一部分 . 以下是本部分的简化版本(2015年1月30日下午2:40美国东部时间编辑): &lt;html&gt; &lt;body&gt; &lt;div id=&quot;main-box&quot;&gt; &lt;div&gt; &lt;div&gt...
  • 0 votes
     answers
     views

    HTMLAgilityPack选择从第一次迭代到div的节点

    我正在尝试使用HTMLAgilityPack首次解析一些网站 . 一切都按预期工作,但仅适用于第一次迭代 . 在每次迭代中,我都会获得带有数据的唯一div,但SelectNodes()始终从第一次迭代中获取数据 . 下面列出的代码解释了问题 工作站的所有属性都从第一次迭代中获取值 . static void Main(string[] args) { List&lt;Sta...
  • 0 votes
     answers
     views

    HtmlAgilityPack - SelectNodes以NullPointer异常间歇性响应

    我是HTMLAgilityPack的新手,但现在逐渐能够在我的程序中成功实现 . 我所遇到的问题是“SelectNodes”间歇性地返回Nullpointer异常 . 但它确实有效 . 我试图强行等待,使用Sleep命令,在代码中调试/步骤,但没有帮助,有时我通过该行,但有时我在该行失败,错误“类型'System.ArgumentNullException'的未处理异常发生在System.Core...
  • 0 votes
     answers
     views

    使用htmlagilitypack从网页中提取所有`href` /请求任何内容

    我有这个网页来源: &lt;a href=&quot;/StefaniStoikova&quot;&gt;&lt;img alt=&quot;&quot; class=&quot;head&quot; id=&quot;face_6306494&quot; src=&quot;http://img0.ask.fm/assets/054/771/271/thumb_tiny/sam_7082.jpg...
  • 0 votes
     answers
     views

    使用HTMLAgilityPack获取select元素的所有值

    这是我到目前为止: HtmlAgilityPack.HtmlDocument ht = new HtmlAgilityPack.HtmlDocument(); TextReader reader = File.OpenText(@&quot;C:\Users\TheGateKeeper\Desktop\New folder\html.txt&quot;); ht....
  • 2 votes
     answers
     views

    如何将HtmlAgilityPack的Htmlnode转换为webbrowser HtmlElement

    我正在创建一个自动将数据插入html输入标签的应用程序 . 我有特定标签的xPath,如'/ html / body / form / div / div [2] / div / div / input',我设法在HtmlAgilityPack的帮助下得到HtmlNode var documentAsIHtmlDocument3 = (mshtml.IHTMLDocument3)webBrowse...
  • 1 votes
     answers
     views

    使用HtmlAgilityPack删除HtmlNode中的HtmlNode

    如何从房屋中删除号码节点及其值? Document : &lt;number&gt;123456&lt;/number&gt; &lt;house&gt; &lt;number&gt; &lt;/number&gt;Red&lt;/house&gt; &lt;house&gt; &lt;number&gt;12&lt;/number&gt;Blue&lt;/house&gt; &lt;number...
  • 1 votes
     answers
     views

    在HtmlAgilityPack中复制HtmlNode?

    我正在使用HTML Agility Pack在同一页面上执行两项不同的操作 .对于第一个我需要删除像脚本,样式等元素 . 但是对于第二个,我必须保留所有元素 . 因为我不能在第一部分之前做第二部分,所以我首先想要一种复制对象的方法,所以我可以保存第二部分的所有元素 . 这是我试过的代码,但是对于一些共鸣,我没有得到它内部的节点 . HtmlDocument HTMLdoc = new HtmlDo...
  • 2 votes
     answers
     views

    htmlAgilityPack HtmlNodeCollection项目与节点集合

    我正在使用htmlAgilityPack来解析一些html值 . 我加载文档,然后执行selectNodes(“/ html / body // a”),一切正常 . 但是,如果我为每个循环做一个像 对于htmlnodecollection.nodes中的每个htmlnode htmlnode对象没有属性,只有标签中的文本 . 如果我使用项目索引(如htmlnodecollection(0))遍历...
  • 5 votes
     answers
     views

    如何在没有使用HtmlAgilityPack的子标签的情况下单独获取innertext?

    我有一个HTML页面,如下所示 . 我需要单独从'span'标签中取出'blah blah blah' . &lt;span class=&quot;news&quot;&gt; blah blah blah &lt;div&gt;hello&lt;/div&gt; &lt;div&gt;bye&lt;/div&gt; &lt;/span&gt; 这给了我所有的 Value : div.Sel...
  • 1 votes
     answers
     views

    如何用string.Empty [duplicate]替换Html Comment <! - comment - >标签

    这个问题在这里已有答案: Accessing Comments in XML using XPath 4个答案 How to strip comments from HTML using Agility Pack without losing DOCTYPE 2个答案 我试图从我的htmlNode中删除所有Html注释标记,以下是我的c#中的HtmlNode选择代码 HtmlNode ...
  • 11 votes
     answers
     views

    HtmlAgilityPack - 如何通过Id获取标签?

    我有一项任务要做 . 我需要检索特定 id 的 tag 或 href ( id 来自用户输入) . 示例我有一个像这样的 html &lt;manifest&gt; &lt;item href=&quot;Text/Cover.xhtml&quot; id=&quot;Cov&quot; media-type=&quot;application/xhtml+xml&quot; /&gt; ...
  • 45 votes
     answers
     views

    HtmlAgilityPack和HtmlDecode

    我目前正在使用带有控制台应用程序的HtmlAgilityPack来抓取一个网站 . 由于html是编码的(它返回编码字符,如 &amp;#039; ),我必须在将内容保存到我的数据库之前进行解码 . 有没有办法使用HtmlAgilityPack解码返回的html而不必使用HttpUtility.HtmlDecode?我希望尽可能避免将System.Web添加到我的控制台应用程序中 .
  • 8 votes
     answers
     views

    HtmlAgilityPack - 获取文档中的所有节点

    我想使用HtmlAgilityPack将遍历documnet中的所有节点 foreach (HtmlNode node in myhtml.DocumentNode.SelectNodes(&quot;//@&quot;)) 做?

热门问题