+-
如何使用Python从网页的inspect元素获取数据
我想使用 Python从inspect元素中获取数据.我可以使用BeautifulSoup下载源代码,但现在我需要来自网页的inspect元素的文本.如果你能告诉我怎么做,我真的很感激.

编辑:
通过检查元素我的意思是,在谷歌浏览器中,右键单击为我们提供了一个名为inspect元素的选项,该选项具有与该特定页面的每个元素相关的代码.我想提取该代码/只是它的文本字符串.

最佳答案
如果您想以运行 Javascript的方式从Python自动获取网页,您应该查看Selenium.它可以自动驱动Web浏览器(甚至是无头Web浏览器,如PhantomJS,因此您不必打开窗口).

为了获取HTML,您需要评估一些JavaScript.简单的示例代码,改为适合:

from selenium import webdriver

driver = webdriver.PhantomJS()
driver.get("http://google.com")

# This will get the initial html - before javascript
html1 = driver.page_source

# This will get the html after on-load javascript
html2 = driver.execute_script("return document.documentElement.innerHTML;")

注意1:如果你想要一个或多个特定的元素,你实际上有几个选项 – 用Python解析HTML,或编写更多特定的JavaScript来返回你想要的东西.

注意2:如果您确实需要Chrome工具中的特定信息,而不仅仅是动态生成的HTML,那么您需要一种方法来嵌入Chrome本身.没办法解决这个问题.

点击查看更多相关文章

转载注明原文:如何使用Python从网页的inspect元素获取数据 - 乐贴网