+-

我想使用 Python从inspect元素中获取数据.我可以使用BeautifulSoup下载源代码,但现在我需要来自网页的inspect元素的文本.如果你能告诉我怎么做,我真的很感激.
编辑:
通过检查元素我的意思是,在谷歌浏览器中,右键单击为我们提供了一个名为inspect元素的选项,该选项具有与该特定页面的每个元素相关的代码.我想提取该代码/只是它的文本字符串.
最佳答案
如果您想以运行 Javascript的方式从Python自动获取网页,您应该查看Selenium.它可以自动驱动Web浏览器(甚至是无头Web浏览器,如PhantomJS,因此您不必打开窗口).
为了获取HTML,您需要评估一些JavaScript.简单的示例代码,改为适合:
from selenium import webdriver
driver = webdriver.PhantomJS()
driver.get("http://google.com")
# This will get the initial html - before javascript
html1 = driver.page_source
# This will get the html after on-load javascript
html2 = driver.execute_script("return document.documentElement.innerHTML;")
注意1:如果你想要一个或多个特定的元素,你实际上有几个选项 – 用Python解析HTML,或编写更多特定的JavaScript来返回你想要的东西.
注意2:如果您确实需要Chrome工具中的特定信息,而不仅仅是动态生成的HTML,那么您需要一种方法来嵌入Chrome本身.没办法解决这个问题.
点击查看更多相关文章
转载注明原文:如何使用Python从网页的inspect元素获取数据 - 乐贴网