-
1 votesanswersviews
c#win8 HtmlAgilityPack麻烦
您好我想从一个网站解析地铁应用程序的HTML . 我看了一些关于HtmlAgilityPack的教程,我觉得它很容易 . 但是当我开始项目时,我看到HtmlAgilityPack库中没有包含一些方法或引用作为我观看的教程 . 示例: 在教程视频中,它说: HtmlWeb web = new HtmlWeb(); HtmlDocument doc = web.Load(“url”); 在我的Ht... -
1 votesanswersviews
HtmlAgilityPack下载通过javascript异步加载的网页
我正在使用HtmlAgilityPack并尝试加载一些网页 . 一些网页是基于JavaScript的,并且异步加载 . 是否有任何方法可以在x秒后或确保页面完全加载后加载网页 -
0 votesanswersviews
如何在Div htmlagilitypack中获取Div
首先..抱歉我的英语不好 我的问题是如何在htmlagilitypack c#中刮取div里面的div# 这是测试HTML代码 <html> <div class="all_ads"> <div class="ads__item"> <div class="test"&... -
12 votesanswersviews
使用HtmlAgilityPack仅选择特定DIV中的项目
我正在尝试使用HtmlAgilityPack从包含在声明为 <div class='content'> 的div中的页面中提取所有链接 . 但是,当我使用下面的代码时,我只需在整个页面上获取所有链接 . 这并不像每次调用SelectNodes时都会返回到根节点 . 我使用的代码如下: HtmlWeb hw = new HtmlWeb(); HtmlDocument doc = hw.L... -
0 votesanswersviews
HtmlAgilityPack HtmlNode如何获取<select>和<option>标签
我正在使用HtmlAgilityPack HtmlNode,我想得到 <select> and <option> and all other html tags. 目前HtmlNode只解析html,table,div,...标签 . 我怎样才能获得选项并选择标签 . 我目前的代码: if (htmlContent != null) { doc.LoadHtml(... -
2 votesanswersviews
循环通过HtmlAgilityPack创建的节点
我需要使用HtmlAgilityPack和C#解析这个html代码 . 我可以得到div class =“patent_bibdata”节点,但我不知道如何通过子节点循环 . 在这个样本中有6个hrefs,但我需要将它们分成两组;发明人,分类 . 我对最后两个不感兴趣 . 此div中可以有任意数量的href . 正如您所看到的,在两组之前有一个文本说明了什么是hrefs . 代码段 HtmlWeb... -
0 votesanswersviews
如何通过属性在Perticular section / div中通过htmlagilitypack选择[复制]
这个问题在这里已有答案: Selecting attribute values with html Agility Pack 6个答案 所以我在服务器端使用Htmlagilitypack来解析C#中的html . 这是一个问题..我有2个div元素 <div> <a data-clear="movies-something"></a> &... -
13 votesanswersviews
在HtmlAgilityPack中运行脚本
我正在尝试抓取一个如下工作的特定网页 . 首先加载页面,然后它运行某种javascript来获取填充页面所需的数据 . 我对这些数据很感兴趣 . 如果我使用HtmlAgilityPack获取页面 - 脚本没有运行,所以我得到它本质上是一个空白页面 . 有没有办法强制它运行脚本,所以我可以获取数据? -
2 votesanswersviews
XPATH查询,HtmlAgilityPack和提取文本
我一直试图从名为“tim_new”的类中提取链接 . 我也得到了一个解决方案 . 解决方案,摘要和必要信息都给出了here 上面说的XPATH查询是 "//a[@class='tim_new'] ,我的问题是,这个查询如何区分片段的第一行(在上面的链接和片段的第二行中给出) . 更具体地说,这个XPATH查询的字面翻译(英文)是什么 . 此外,我想写几行代码来提取针对 NSE: 的文本... -
-1 votesanswersviews
Gzip,HTMLAgilitypack
我在HTMLAgillityPack错误中遇到Gzip的一些问题 - 'gzip'不是受支持的编码名称 码: var url = "http://poe.trade/search/arokazugetohar"; var web = new HtmlWeb(); var htmldoc = web.Load(url); -
0 votesanswersviews
ASP.NET Core HtmlAgilityPack编码错误
有一些关于编码问题的帖子和 HtmlAgilityPack 但是这个问题没有得到解决: 因为我尝试解析的网站包含像 € 或 ä 这样的Unicode符号, ü 我尝试将编码设置为Unicode: public class WebpageDeserializer { public WebpageDeserializer() {} /* * Example address:... -
0 votesanswersviews
(不可能)在Unity中找不到HtmlAgilityPack
我有HtmlAgilityPack的问题...我已经在Visual Studio中正确导入了包(参考>管理NuGet包>浏览,只是安装了包)在Unity中我收到此错误: Assets / Scripts / Searcher.cs(13,7):错误CS0246:找不到类型或命名空间名称'HtmlAgilityPack' . 你错过了装配参考吗? 我没有忘记在我的脚本中添加两个 us... -
36 votesanswersviews
HtmlAgilityPack选择childNodes不符合预期
我试图使用HtmlAgilityPack库来解析页面中的一些链接,但我没有看到我期望从这些方法得到的结果 . 在下面我有一个HtmlNodeCollection的链接 . 对于每个链接,我想检查是否有图像节点,然后解析其属性,但linkNode的SelectNodes和SelectSingleNode方法似乎在搜索父文档而不是linkNode的childNodes给出了什么? HtmlDocume... -
1 votesanswersviews
HtmlAgilityPack:Descendants vs Xpath
我正在使用HtmlAgilityPack lib,并从我有限的xpath知识中了解一些问题 . 如下面的代码示例所示,从即时窗口,table是从DocumentNode中选择的htmlnode . 因此,如果选择“/ div”,则选择“div”,选择“div”,“// div”选择文档中的所有div(因此它不会仅找到它的后代 . 因此我选择了table.Descendants相反,它给了我想要的5... -
1 votesanswersviews
HtmlAgilityPack - SelectNodes在一种情况下返回节点,在另一种情况下返回null(对于相同的html)?
我有一个非常简单的html页面,看起来像这样: (index.html的): <html> <head> <title>Test</title> </head> <body bgcolor="white" text="black"> <center><h1>Tes... -
0 votesanswersviews
HtmlAgilityPack - 使用c#解析带有cookie /标签的网站
当我想从网页获取数据时,我通常使用带有HtmlDocument对象的HtmlAgilityPack,该对象使用网站的主网址,然后使用主表的HtmlNode对象,例如我想从页面获取的所有数据并复制它的XPath进入输入 . 例: HtmlDocument hDocument = GetHtmlDocumentFromUrl("http://someweb.com"); HtmlN... -
4 votesanswersviews
XPath在浏览器和HtmlAgilityPack中给出不同的结果
我试图在C#程序中使用HtmlAgilityPack解析网页的一部分 . 以下是本部分的简化版本(2015年1月30日下午2:40美国东部时间编辑): <html> <body> <div id="main-box"> <div> <div>... -
0 votesanswersviews
HTMLAgilityPack选择从第一次迭代到div的节点
我正在尝试使用HTMLAgilityPack首次解析一些网站 . 一切都按预期工作,但仅适用于第一次迭代 . 在每次迭代中,我都会获得带有数据的唯一div,但SelectNodes()始终从第一次迭代中获取数据 . 下面列出的代码解释了问题 工作站的所有属性都从第一次迭代中获取值 . static void Main(string[] args) { List<Sta... -
0 votesanswersviews
HtmlAgilityPack - SelectNodes以NullPointer异常间歇性响应
我是HTMLAgilityPack的新手,但现在逐渐能够在我的程序中成功实现 . 我所遇到的问题是“SelectNodes”间歇性地返回Nullpointer异常 . 但它确实有效 . 我试图强行等待,使用Sleep命令,在代码中调试/步骤,但没有帮助,有时我通过该行,但有时我在该行失败,错误“类型'System.ArgumentNullException'的未处理异常发生在System.Core... -
0 votesanswersviews
使用htmlagilitypack从网页中提取所有`href` /请求任何内容
我有这个网页来源: <a href="/StefaniStoikova"><img alt="" class="head" id="face_6306494" src="http://img0.ask.fm/assets/054/771/271/thumb_tiny/sam_7082.jpg... -
0 votesanswersviews
使用HTMLAgilityPack获取select元素的所有值
这是我到目前为止: HtmlAgilityPack.HtmlDocument ht = new HtmlAgilityPack.HtmlDocument(); TextReader reader = File.OpenText(@"C:\Users\TheGateKeeper\Desktop\New folder\html.txt"); ht.... -
2 votesanswersviews
如何将HtmlAgilityPack的Htmlnode转换为webbrowser HtmlElement
我正在创建一个自动将数据插入html输入标签的应用程序 . 我有特定标签的xPath,如'/ html / body / form / div / div [2] / div / div / input',我设法在HtmlAgilityPack的帮助下得到HtmlNode var documentAsIHtmlDocument3 = (mshtml.IHTMLDocument3)webBrowse... -
1 votesanswersviews
使用HtmlAgilityPack删除HtmlNode中的HtmlNode
如何从房屋中删除号码节点及其值? Document : <number>123456</number> <house> <number> </number>Red</house> <house> <number>12</number>Blue</house> <number... -
1 votesanswersviews
在HtmlAgilityPack中复制HtmlNode?
我正在使用HTML Agility Pack在同一页面上执行两项不同的操作 .对于第一个我需要删除像脚本,样式等元素 . 但是对于第二个,我必须保留所有元素 . 因为我不能在第一部分之前做第二部分,所以我首先想要一种复制对象的方法,所以我可以保存第二部分的所有元素 . 这是我试过的代码,但是对于一些共鸣,我没有得到它内部的节点 . HtmlDocument HTMLdoc = new HtmlDo... -
2 votesanswersviews
htmlAgilityPack HtmlNodeCollection项目与节点集合
我正在使用htmlAgilityPack来解析一些html值 . 我加载文档,然后执行selectNodes(“/ html / body // a”),一切正常 . 但是,如果我为每个循环做一个像 对于htmlnodecollection.nodes中的每个htmlnode htmlnode对象没有属性,只有标签中的文本 . 如果我使用项目索引(如htmlnodecollection(0))遍历... -
5 votesanswersviews
如何在没有使用HtmlAgilityPack的子标签的情况下单独获取innertext?
我有一个HTML页面,如下所示 . 我需要单独从'span'标签中取出'blah blah blah' . <span class="news"> blah blah blah <div>hello</div> <div>bye</div> </span> 这给了我所有的 Value : div.Sel... -
1 votesanswersviews
如何用string.Empty [duplicate]替换Html Comment <! - comment - >标签
这个问题在这里已有答案: Accessing Comments in XML using XPath 4个答案 How to strip comments from HTML using Agility Pack without losing DOCTYPE 2个答案 我试图从我的htmlNode中删除所有Html注释标记,以下是我的c#中的HtmlNode选择代码 HtmlNode ... -
11 votesanswersviews
HtmlAgilityPack - 如何通过Id获取标签?
我有一项任务要做 . 我需要检索特定 id 的 tag 或 href ( id 来自用户输入) . 示例我有一个像这样的 html <manifest> <item href="Text/Cover.xhtml" id="Cov" media-type="application/xhtml+xml" /> ... -
45 votesanswersviews
HtmlAgilityPack和HtmlDecode
我目前正在使用带有控制台应用程序的HtmlAgilityPack来抓取一个网站 . 由于html是编码的(它返回编码字符,如 &#039; ),我必须在将内容保存到我的数据库之前进行解码 . 有没有办法使用HtmlAgilityPack解码返回的html而不必使用HttpUtility.HtmlDecode?我希望尽可能避免将System.Web添加到我的控制台应用程序中 . -
8 votesanswersviews
HtmlAgilityPack - 获取文档中的所有节点
我想使用HtmlAgilityPack将遍历documnet中的所有节点 foreach (HtmlNode node in myhtml.DocumentNode.SelectNodes("//@")) 做?