本文摘自php中文网,作者不言,侵删。
下面为大家分享一篇python爬虫 使用真实浏览器打开网页的两种方法总结,具有很好的参考价值,希望对大家有所帮助。一起过来看看吧1.使用系统自带库 os
这种方法的优点是,任何浏览器都能够使用, 缺点不能自如的打开一个又一个的网页
1 2 | import os
os.system( '"C:/Program Files/Internet Explorer/iexplore.exe" http://www.baidu.com' )
|
2.使用python 集成的库 webbroswer
python的webbrowser模块支持对浏览器进行一些操作,主要有以下三个方法:
1 2 3 4 | import webbrowser
webbrowser.open(url, new =0, autoraise=True)
webbrowser.open_new(url)
webbrowser.open_new_tab(url)
|
他们虽然是三个方法, 其实还是一个方法, 只是传递的参数不同
webbrowser.open(url, new=0, autoraise=True) 在系统的默认浏览器中访问url地址,如果new=0, url会在同一个
浏览器窗口中打开;如果new=1,新的浏览器窗口会被打开;new=2 新的浏览器tab会被打开
其他的两个函数 webbrowser.open_new(url),webbrowser.open_new_tab(url)其实都是返回了webbrowser.open() 这个方法
只是他们没有其他的两个参数了。
在调用其他的浏览器的时候需要提前注册, 否则打开页面的是默认浏览器
1 2 3 4 | import webbrowser
chromePath = r '你的浏览器目录' # 例如我的:D:\Google\Chrome\Application\chrome.exe
webbrowser.register( 'chrome' , None, webbrowser.BackgroundBrowser(chromePath)) #这里的 'chrome' 可以用其它任意名字,如chrome111,这里将想打开的浏览器保存到 'chrome'
webbrowser.get( 'chrome' ).open( 'www.baidu.com' , new =1,autoraise=True)
|
webbrowser 这个库锁支持的浏览器类型如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 | Type Name Class Name Notes
'mozilla' Mozilla( 'mozilla' )
'firefox' Mozilla( 'mozilla' )
'netscape' Mozilla( 'netscape' )
'galeon' Galeon( 'galeon' )
'epiphany' Galeon( 'epiphany' )
'skipstone' BackgroundBrowser( 'skipstone' )
'kfmclient' Konqueror() (1)
'konqueror' Konqueror() (1)
'kfm' Konqueror() (1)
'mosaic' BackgroundBrowser( 'mosaic' )
'opera' Opera()
'grail' Grail()
'links' GenericBrowser( 'links' )
'elinks' Elinks( 'elinks' )
'lynx' GenericBrowser( 'lynx' )
'w3m' GenericBrowser( 'w3m' )
'windows-default' WindowsDefault (2)
'macosx' MacOSX( 'default' ) (3)
'safari' MacOSX( 'safari' ) (3)
'google-chrome' Chrome( 'google-chrome' )
'chrome' Chrome( 'chrome' )
'chromium' Chromium( 'chromium' )
'chromium-browser' Chromium( 'chromium-browser' )
|
这些内容都可以在 源文件中看到, 路径为: python2.7/libs/webbroser.py
相关推荐:
如何用Python爬虫获取那些价值博文
记录一次简单的Python爬虫实例
以上就是python爬虫 使用真实浏览器打开网页的两种方法总结的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
Python的缩进规则是什么
Python判断字符类型怎么做
Python基于递归算法实现的汉诺塔与fibonacci数列
如何用Python计算1到100的和?
Python怎么定义一个变量
pandas技巧之 详解dataframe中的apply与applymap方法
非常适合菜鸟练手的3道趣味Python题
Python打印星号金字塔的方法
Python实现求一个集合所有子集的示例
在 Python 中如何得到对象的所有属性
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » python爬虫 使用真实浏览器打开网页的两种方法总结