Nothing Special   »   [go: up one dir, main page]

CN106776634A - 一种用于网络访问的方法、装置及终端设备 - Google Patents

一种用于网络访问的方法、装置及终端设备 Download PDF

Info

Publication number
CN106776634A
CN106776634A CN201510821183.8A CN201510821183A CN106776634A CN 106776634 A CN106776634 A CN 106776634A CN 201510821183 A CN201510821183 A CN 201510821183A CN 106776634 A CN106776634 A CN 106776634A
Authority
CN
China
Prior art keywords
page
classification
page elements
accessed
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510821183.8A
Other languages
English (en)
Inventor
苏磊
白道贵
齐彦鹏
张春
彭涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201510821183.8A priority Critical patent/CN106776634A/zh
Publication of CN106776634A publication Critical patent/CN106776634A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及通信领域,公开了一种用于网络访问的方法、装置及终端设备,以解决现有技术中网络访问效率低的技术问题。该方法包括:首先检测获得访问第一网络链接的访问操作;然后响应所述访问操作,确定所述第一网络链接所对应的第一被访问页面;最后,获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。由于检测到访问操作时,会获得第一被访问页面所对应的至少一个类别的页面元素,故而用户可以选择自己感兴趣的类别下的页面元素进行访问,从而达到了提高网络访问效率的技术效果。

Description

一种用于网络访问的方法、装置及终端设备
技术领域
本发明涉及通信领域,尤其涉及一种用于网络访问的方法、装置及终端设备。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的电子设备,享受随着科技发展带来的舒适生活。例如,笔记本电脑、台式电脑、智能手机、平板电脑等电子设备已经成为人们生活中一个重要的组成部分,用户可以使用手机、平板电脑等电子设备来听音乐、玩游戏等等,以减轻现代快节奏生活所带来的压力。
通常情况下,大部分电子设备都具备网络访问功能,在网络访问过程中,浏览器内核的主要作用是进行网页的渲染:将HTML/CSS/JavaScript文本以及其相应的资源文件转换成可视化或可听化的结果。这一过程中,通常而言,会有以下流程:1、通过HTML解释器对HTML文本进行解释得到DOM树。2、CSS解释器为DOM中的各个元素对象计算样式信息。3、内核将DOM中的元素对象和CSS给出的样式信息进行结合并且进行排版,形成一个内部表示模型。4、JavaScript解释器根据网页中的JavaScript脚本对网页内容和样式信息进行修改。5、将网页绘制成为图像,并且通过浏览器窗口将网页内容显示出来。
用户通过输入网络链接或者点击网络链接,就可以访问对应的被访问页面,被访问页面往往包含很多内容,例如:文字、图像、视频、音频等等,有些情况下,还会包含大量的广告,而不同的用户的关注重点并不相同,用户需要从被访问页面所包含的大量内容中筛选出用户所感兴趣的内容,故而存在着网络访问效率低的技术问题。
并且,越来越多的前端程序中会通过JavaScript代码和/或CSS代码将某些标签设置为不可见或尺寸为0,这样的后果是,用户只有在执行特殊动作的情况下才能知道这些标签所包含的资源的存在,这就导致,用户很可能会在浏览网页的时候丢失掉某些信息,由此可见,还存在着获取的网络资源不够全面的技术问题。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种用于网络访问的方法及相应的装置、终端设备。
为了解决上述问题,第一方面,本发明实施例公开了一种用于网络访问的方法,包括:
检测获得访问第一网络链接的访问操作;
响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
可选的,所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体包括:
遍历所述第一被访问页面的文档对象化模型DOM树;从所述DOM树中识别出所述至少一个类别的页面元素;或者
在进行网页文档解析的过程中,基于生成DOM树过程中所确定出的各个页面元素的类别统计出所述至少一个类别的页面元素。
可选的,所述从所述DOM树中识别出所述至少一个类别的页面元素,具体包括:
通过各个页面元素的标签信息确定出对应页面元素的类别信息,进而提取所述至少一个类别的页面元素;或者
通过各个页面元素的网络链接的后缀名确定出对应页面元素的类别信息,进而获得所述至少一个类别的页面元素。
可选的,所述至少一个类别具体包括:文字类别、图像类别、视频类别、音频类别、链接类别中的至少一个类别。
可选的,所述从所述DOM树中识别出所述至少一个类别的页面元素,还包括:
判断所述链接类别下的每个链接信息是否包含特定字符;
在第一链接信息包含所述特定字符时,将所述第一链接信息加入所述特定字符所对应的类别。
可选的,在所述获取所述第一被访问页面所包含的至少一个类别的页面元素之前,所述方法还包括:
判断当前终端设备是否接收到预设操作,所述预设操作具体为:点击预设按钮、触发弹出菜单中的至少一种操作;
所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体为:在检测到所述预设操作时,提取所述至少一个类别的页面元素。
可选的,所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体包括:
在从网络服务器获取所述第一被访问页面之后,从所述第一被访问页面提取所述至少一个类别的页面元素;或者
从网络服务器获取预存的所述第一被访问页面所包含的至少一个类别的页面元素。
可选的,所述方法还包括:对所述第一被访问页面中处于隐藏状态的页面元素进行提示。
可选的,在所述获取所述第一被访问页面所包含的至少一个类别的页面元素之后,所述方法还包括:
对每个类别下的页面元素按照第一预设规则进行排序;和/或
从第一类别下提取出满足第二预设规则的页面元素,所述第一类别具体为所述至少一个类别中的任一类别;和/或
确定出第二类别下的页面元素的统计特征信息,所述第二类别具体为所述至少一个类别中的任一类别;和/或
确定出第一页面元素的属性信息,所述第一页面元素为所述至少一个类别中的任一页面元素。
第二方面,本发明实施例提供一种用于网络访问的装置,包括:
检测模块,用于检测获得访问第一网络链接的访问操作;
响应模块,用于响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取模块,用于获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
第三方面,本发明实施例提供一种终端设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
检测获得访问第一网络链接的访问操作;
响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
可选的,所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
遍历所述第一被访问页面的文档对象化模型DOM树;从所述DOM树中识别出所述至少一个类别的页面元素;或者
在进行网页文档解析的过程中,基于生成DOM树过程中所确定出的各个页面元素的类别统计出所述至少一个类别的页面元素。
可选的,所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在从网络服务器获取所述第一被访问页面之后,从所述第一被访问页面提取所述至少一个类别的页面元素;或者
从网络服务器获取预存的所述第一被访问页面所包含的至少一个类别的页面元素。
可选的,所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对所述第一被访问页面中处于隐藏状态的页面元素进行提示。
本发明有益效果如下:
由于在本发明实施例中,首先检测获得访问第一网络链接的访问操作;然后响应所述访问操作,确定所述第一网络链接所对应的第一被访问页面;最后,获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。由于检测到访问操作时,会获得第一被访问页面所对应的至少一个类别的页面元素,故而用户可以选择自己感兴趣的类别下的页面元素进行访问,从而达到了提高网络访问效率的技术效果。
附图说明
图1为本发明实施例中用于网络访问的方法的流程图;
图2为本发明实施例用于网络访问的方法中从DOM树中识别至少一个类别的页面元素的流程图;
图3为本发明实施例中用于网络访问的装置的结构图;
图4是根据一示例性实施例示出的一种用于网络访问的终端设备的框图;
图5是本发明实施例中网络服务器的结构示意图。
具体实施方式
本发明提供一种用于网络访问的方法、装置及终端设备,以解决现有技术中网络访问效率低的技术问题。
本申请实施例中的技术方案为解决上述的技术问题,总体思路如下:
首先检测获得访问第一网络链接的访问操作;然后响应所述访问操作,确定所述第一网络链接所对应的第一被访问页面;最后,获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。由于检测到访问操作时,会获得第一被访问页面所对应的至少一个类别的页面元素,故而用户可以选择自己感兴趣的类别下的页面元素进行访问,从而达到了提高网络访问效率的技术效果。并且,让用户对当前页面的认识更加精确和全面,有效防止发生遗漏网页信息的问题。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
第一方面,本发明实施例提供一种用于网络访问的方法,请参考图1,包括:
步骤S101:检测获得访问第一网络链接的访问操作;
步骤S102:响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
步骤S103:获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
举例来说,该方案应用于具备网络访问功能的终端设备,该终端设备例如为:PC、笔记本电脑、手机、平板电脑等等,本发明实施例不作限制。
步骤S101中,访问第一网络链接的访问操作例如为:在浏览器中输入第一网络链接并点击回车键的操作、点击第一网络链接所对应的锚文本的操作等等,对于该访问操作为何种访问操作,本发明实施例不作限制。
步骤S102中,可以将第一网络链接发送至网络服务器,进而从网络服务器获取第一被访问页面。
步骤S103中,所述至少一个类别例如为:文字类别、图像类别、视频类别、音频类别、链接类别中的至少一个类别。
在具体实施过程中,步骤S103之前,可以在多种时机触发获取至少一个类别的页面元素的过程,下面列举其中的两种时机进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,在所述获取所述第一被访问页面所包含的至少一个类别的页面元素之前,所述方法还包括:判断当前终端设备是否接收到预设操作,所述预设操作具体为:点击预设按钮、触发弹出菜单中的至少一种操作;
所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体为:在检测到所述预设操作时,提取所述至少一个类别的页面元素。
举例来说,可以在浏览器上设置预设按钮,在检测到用户点击该预设按钮的操作时,则说明用户希望获取至少一个类别的页面元素,进而在这种情况下,才触发提取出至少一个页面元素的操作;
又或者,可以设置触发弹出菜单的操作为提取至少一个页面元素的操作,若检测到触发弹出菜单的操作,则说明用户希望获取至少一个类别的页面元素。其中,如果终端设备的显示单元并非触控屏(例如:PC),则触发弹出菜单的操作具体为:点击鼠标右键的操作,如果终端设备的显示单元为触控屏(例如:手机、平板电脑等等),则触发弹出菜单的操作具体为:在浏览器的特定区域长按触控屏的操作等等。
其中,至少一个类别的页面元素例如为第一被访问页面所包含的所有类别的页面元素,则可以在浏览器顶部设置“提取”按钮,在检测到用户点击“提取”按钮的操作时,则提取第一被访问页面所包含的所有类别的页面元素;至少一个类别的页面元素也可以为第一被访问页面所包含的部分类别的页面元素,例如:针对每个类别的页面元素分别设置不同的按钮,例如:针对文字类别设置“文字”按钮,针对图像类别设置“图像”按钮,针对视频类别设置“视频”按钮,针对音频类别设置“音频”按钮,针对链接类别设置“链接”按钮等等,其中,如果检测到点击“文字”按钮的操作,则提取第一被访问页面中所包含的文字,如果检测到点击“图像”按钮的操作,则提取第一被访问页面所包含的图像等等。当然,针对每个类别还可以设置其他按钮,本发明实施例不再详细列举,并且不作限制。
第二种,在获取到所述第一网络链接所对应的第一被访问页面之后,直接获得至少一个类别的页面元素,也即是不需要检测到用户的触发操作,而是直接获取至少一个类别的页面元素。
步骤S103中,至少一个类别的页面元素可以从多个位置获取,下面列举其中的两个获取位置进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,从网络服务器获取至少一个类别的页面元素。
举例来说,可以直接在网络服务器对第一被访问页面所包含的页面元素进行统计分析,进而从中提取出各个类别的页面元素,并将各个类别的页面元素预存于网络服务器,然后应终端设备的用户的请求、或者主动将至少一个类别的页面元素发送至终端设备。通过该方案能够提高获得至少一个类别的页面元素的提取速度。
第二种,在终端设备从网络服务器获取第一被访问页面之后,从第一被访问页面中提取出至少一个类别的页面元素。
举例来说,在基于第一网络链接获得第一被访问页面之后,可以通过对第一被访问页面进行统计分析,进而提取出其中所包含的至少一个类别的页面元素。
其中,在获得至少一个类别的页面元素之后,可以将获得的页面元素进行分类存储。
步骤S103中,不管是网络服务器还是终端设备,都可以通过多种方式获取第一被访问页面所包含的至少一个类别的页面元素,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
第一种,所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体包括:遍历所述第一被访问页面的文档对象化模型DOM树;从所述DOM树中识别出所述至少一个类别的页面元素。
举例来说,DOM是文档对象化模型(Document Object Model)的简称。以通过终端设备统计出至少一个类别的页面元素为例,用户通过浏览器浏览网页的过程中,浏览器内核将负责HTML文本的解释、javascript脚本的处理和CSS的解释,也就是说内核可以知道所访问的网页的全部资源的信息。并且浏览器内核会将这些资源以树的形式在内部表示,通常这棵树被称作DOM树,借助DOM树,能直接而且简易的操作HTML页面上的每个页面元素。
而如果通过网络服务器统计出至少一个类别的页面元素,则可以在网络服务器预置对HTML文本进行解释、javascript脚本进行处理和CSS进行解释的应用程序,然后通过该应用程序生成DOM树,进而基于该DOM树获得至少一个类别的页面元素。
在具体实施过程中,又可以通过多种方式从DOM树中识别出至少一个类别的页面元素,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况。
①通过各个页面元素的标签信息确定出对应页面元素的类别信息,进而提取所述至少一个类别的页面元素。
举例来说,如果某页面元素的标签信息为“video”,则可以确定出该页面元素属于视频类别;如果某页面元素的标签信息为“image”,则可以确定出该页面元素属于图像类别;如果某页面元素的标签信息为“audio”,则可以确定出该页面元素属于音频类别;如果某页面元素的标签信息为“anchor”,则可以确定出该页面元素的类别为链接类别,如果某页面元素的标签信息为“b”、“p”等等,则可以确定出该页面元素的类别为文字类别等等。当然,页面元素的标签信息还可以为其他标签信息,本发明实施例不再详细列举,并且不作限制。
另外,在基于标签信息确定出每个页面元素的类别信息之后,还可以获取每个页面元素的属性信息,并基于每个页面元素的属性信息对该页面元素进行再次分类,例如:假设某页面元素的标签信息为“video”,则确定出该页面元素所述的类别为视频类别;在确定出该页面元素所属的类别为视频类别之后,确定出该页面元素的属性信息包括“poster”、“src”,通常情况下“poster”对应该页面元素的宣传图片的链接地址,“src”对应该页面元素的视频信息的链接地址,在这种情况下,则除了可以将该页面元素划分为视频类别之后,还可以将该页面元素划分为图像类别,也即该页面元素属于两个类别:分别为图像类别和视频类别,从而具有对页面元素所属的类别划分更加详细的技术效果。
②通过各个页面元素的网络链接的后缀名确定出对应页面元素的类别信息,进而获得所述至少一个类别的页面元素。
举例来说,如果某页面元素所包含的资源的网络链接的后缀名为“rm”、“rmvb”、“mpeg1-4”、“mov”等等,则可以确定出该页面元素属于视频类别;如果某页面元素所包含的资源的网络链接的后缀名为bmp、“gif”、“jpg”、“pic”、“png”、“tif”等等,则可以确定出该页面元素属于图像类别;如果某页面元素所包含的资源的网络链接的后缀名为“mp3”、“wma”等等,则可以确定出该页面元素属于音频类别;如果某页面元素所包含的资源的网络链接的后缀名为“html”、“index.asp”等等,则可以确定出该页面元素的类别为链接类别等等。当然,页面元素所包含的资源的网络链接的后缀名还可以为其他后缀名,本发明实施例不再详细列举,并且不作限制。
另外,在具体实施过程中,以上两种方式可以组合使用,例如:先通过各个页面元素的标签信息确定出对应页面元素的类别信息,在通过标签信息无法确定出对应页面元素的类别信息的情况下,可以进一步的通过对应页面元素的网络链接的后缀名来确定出对应页面元素的类别信息,基于该方案能够更加详细的对各个页面元素进行分类。
第二种,所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体包括:在浏览器获得第一被访问页面所包含的HTML文档、CSS文档和JavaScript之后,在进行网页文档解析的过程中,基于生成DOM树过程中所确定出的各个页面元素的类别统计出所述至少一个类别的页面元素。
也即是说,并不需要等待生成DOM树之后,才提取每个类别的页面元素,而是在生成DOM树的过程中,每获得一个页面元素就将其划分到对应的类别中,进而在生成DOM树结束之后,就可以直接获得至少一个类别的页面元素。
其中,通过上述方案提取至少一个类别的页面元素的方式与先生成DOM树再遍历提取至少一个类别的页面元素的方式类似,故而在此不再赘述。
通过上述第二种方案能够提高提取至少一个类别的页面元素的速率。
作为一种可选的实施例,所述从所述DOM树中识别出所述至少一个类别的页面元素,请参考图2,还包括:
步骤S201:判断所述链接类别下的每个链接信息是否特定字符;
步骤S202:在第一链接信息包含所述特定字符时,将所述第一链接信息加入所述特定字符所对应的类别。
举例来说,不同种类的资源的属性丰富程度是不同的,尽量将资源划分为属性丰富的类别。anchor标签下面的链接信息是一类比较特殊的资源,如果单纯地将这类链接信息分类为链接类别,那么除了告知当前页面内有这个链接,几乎不能向用户提供更多有用的信息。因此对资源进行分类的时候,还可以不局限于网页元素的种类,而是充分利用该url的特性进行分类,从而实现对页面内容更加精细的划分。
步骤S201中,可以针对各个类别分别设置不同的特定字符,例如:针对图像类别设置特定字符“img”、针对音频类别设置特定字符“audio”、针对视频类别设置特定字符“video”等等,当然,针对各个类别还可以设置其他特定字符,本发明实施例不再详细列举,并且不作限制。
步骤S202中,针对每一条链接信息可以分别判断该链接信息是否包含特定字符,如果包含的话,再确定该特定字符的类别,例如:如果某一条链接信息中包含特定字符“img”,则确定该链接信息所属的类别为图像类别;如果某一条链接信息中包含特定字符“audio”,则确定该链接信息所属的类别为音频类别;如果某一条链接信息中包含特定字符“video”,则确定该链接信息所属的类别为视频类别等等。而针对无法通过上述方式划分类别的链接信息,则确定其类别为链接类别。
在具体实施过程中,在获得至少一个类别的页面元素之后,可以将至少一个类别的页面元素提供给终端设备的用户,其中,可以通过弹窗的方式、浮动窗口的方式将至少一个类别的页面元素提供给用户等等。在将至少一个类别的页面元素提供给用户,可以在获得至少一个类别的页面元素之后就将其提供给用户,也可以应用户的触发操作(例如:点击某预设按钮、产生快捷操作等等)将其提供给用户,本发明实施例不作限制。
例如,当使用搜索引擎使用“A明星”关键词进行搜索的时候,获得的第一被访问页面内可能会有关于A明星的文字介绍、A明星的音乐作品、还会有A明星的图像。从空间位置上看,所有关于A明星的图像、音乐作品和文字都是混合存在的。在用户触发本申请的功能之后,就可以确定出第一被访问页面包含哪些类别的页面元素,同时还可以将不同类别的页面元素显示于不同的区域,以方便用户查看。例如:在显示单元上面建立三个弹出窗口,分别显示A明星的图像、音乐作品以及文字,用户对A明星哪个方面的内容感兴趣,就查看哪个弹出窗口的内容。另外,除了显示每个种类的页面元素之外,还可以显示每个种类的页面元素的数量以及属性信息等等,本发明实施例不作限制。
另外,在显示每个类别的页面元素时,还可以基于每个类别的页面元素的属性继续对各个页面元素进行分类,例如:针对图像类别,可以基于图像的后缀名对其继续分类,将同一后缀名的图像显示于同一区域;针对视频类别,可以基于视频的分辨率对其进行分类,将分辨率大于预设分辨率的显示于同一区域,分辨率不大于预设分辨率的显示于另一区域等等,对于具体如何对每个类别的页面元素进行继续分类,本发明实施例不再详细列举,并且不作限制。
另外,作为一种可选的实施例,除了将至少一个类别的页面元素提供给用户之外,还可以将第一被访问页面提供给用户,例如:在获得第一被访问页面的DOM树之后,浏览器内核通过该DOM树对第一被访问页面进行排版绘制,然后通过终端设备的显示单元显示第一被访问页面的排版绘制结果。
另外,如果检测到访问第一网络链接的访问操作之后,只将至少一个类别的页面元素提供给用户,而不将第一被访问页面提供给用户的话,则还可以设置特定按钮(例如:设置于浏览器顶部、设置于至少一个页面元素的显示区域等等),进而在检测到触发特定按钮的操作之后,可以向用户提供第一被访问页面。
在将至少一个类别的页面元素提供给用户时,还可以主动或者应用户操作对这些页面元素进行一些相关处理,下面介绍其中的几种操作方式,当然,在具体实施过程中,不限于以下几种情况。
第一种,对所述第一被访问页面中处于隐藏状态的页面元素进行提示。
举例来说,以页面元素为图像为例,如果该图像的标签信息的属性设置为“隐藏”、又或者该图像的显示尺寸设置为“0px*0px”,则说明该图像处于隐藏状态,在这种情况下,可以对该图像进行提示。针对其他类型的页面元素,如果检测到其标签信息的属性信息设置为“隐藏”,则也可以确定出对应的页面元素处于隐藏状态。通过上述方案,达到了能够对处于隐藏状态的页面元素进行提取并提示的技术效果。
其中,在对处于隐藏状态的页面元素进行提示时,可以在显示窗口显示该类别的页面元素时,针对该页面元素进行提示,例如:加边框、通过文字注明等等;也可以单独新建一个窗口,显示处于隐藏状态的页面元素,对于采用何种方式对处于隐藏状态的页面元素进行提示,本发明实施例不作限制。
第二种,对每个类别下的页面元素按照第一预设规则进行排序。
举例来说,在获得至少一个类别的页面元素之后,还可以获得每个页面元素的属性信息,以页面元素为图像为例,则其属性信息例如为:分辨率、大小、风格等等;以页面元素为视频为例,则其属性信息例如为:分辨率、播放时长等等;以页面元素为音频为例,则其属性信息例如为:播放时长、音频类别(例如:纯音乐、流行音乐)等等。
以页面元素所属的类别为图像类别为例,如果用户希望下载一张高像素质量的照片,则可以将图像元素按照像素从高到低的顺序进行排序,从而用户可以从中选择出排序位于最前面的图像进行下载,又或者也可以按照分辨率从高到低的顺序对图像进行排序;针对视频元素可以按照其分辨率从高到低的顺序进行排序;针对音频元素可以按照其播放时长由高至低排序等等,对于第一预设规则为何种规则,本发明实施例不再详细列举,并且不作限制。
通过上述方案,达到了能够对每个类别下的页面元素进行排序的技术效果,从而对每个类别的页面元素的显示更加满足用户需求。
第三种,从第一类别下提取出满足第二预设规则的页面元素,所述第一类别具体为所述至少一个类别中的任一类别。
以页面元素为图像信息为例,第二预设规则例如为:长和宽分别大于预设尺寸,其中,预设尺寸可以根据用户的需求进行自行设定,通过该方案能够将大于预设尺寸的图像信息提供给用户;其中,作为一种可选的实施例,预设尺寸例如为:常用图标所对应的尺寸,可以检测获得各个网站的常用图标,然后获得其中尺寸较大的常用图标的尺寸作为预设尺寸,通过该方案能够保证提出来的图像不包含或者包含较少的图标。
又或者,第二预设规则例如为:没有压缩过的图像,其中,可以通过图像的后缀名确定出图像是否被压缩,例如:如果图像后缀名为bmp,则确定该图像没有被压缩;如果图像后缀名为gif、jpeg,则确定该图像有被压缩。当然,在具体实施过程中,还可以通过其他方式确定出图像是否被压缩,本发明实施例不再详细列举,并且不作限制。
又或者,第二预设规则例如为:预定格式的图像,预定格式例如为:gif格式、jpeg格式等等,本发明实施例不作限制。
以页面元素为视频为例,第二预设规则例如为:视频分辨率大于预设分辨率,可以根据实际需求设置不同的预设分辨率,本发明实施例不作限制。
以页面元素为音频为例,第二预设规则例如为:播放时长大于预设时长,可以根据实际需求设置不同的预设时长,本发明实施例不作限制。
通过上述方案,能够提高获取满足第二预设规则的页面元素的速率,从而进一步的提高网络浏览效率。
第四种,确定出第二类别下的页面元素的统计特征信息,所述第二类别具体为所述至少一个类别中的任一类别。
举例来说,也即是可以获取第二类别下的各个页面元素的属性信息,然后对各个页面元素的属性信息进行统计分析,进而获得统计特征信息。以页面元素为图像为例,该统计特征信息例如为:图像的类别、每个类别下的图像数量等等,例如,获得如表1所示的统计特征信息:
表1
图像类别 bmp jpeg gif tif
数量 3 12 37 1
当然,以上图像的统计特征信息仅仅作为一个举例,并不作为限制。
以页面元素为文字为例,该统计特征信息例如为:文字段落数量、各个段落所使用的字体、文字数量等等。其中可以通过识别标签类型以及识别文本中的段落分隔符来对第一被访问页面的段落数进行统计,可以通过计算所有段落的字符长度之和给出当前页面的文字总数,可以通过查看css属性知道所使用的字体种类等等。
其中,在确定出页面元素的统计特征信息之后,还可以基于页面元素的统计特征信息查看对应的页面元素。以页面元素为图像为例,则可以显示上述四个类别的图像的选择框,用户点击对应的选择框,就进入对应类别的图像的浏览界面;以页面元素为文字为例,则可以显示各个字体的选择框,用户点击对应的选择框,则跳转至对应的字体所对应的段落等等。
通过上述方案,达到了能够方便每个类别下的页面元素的统计特征信息进行统计的技术效果。
第五种,确定出第一页面元素的属性信息,所述第一页面元素为所述至少一个类别中的任一页面元素。
以第一页面元素为图像为例,第一页面元素的属性信息例如为:图像的长、宽、大小和格式等属性,例如:如果当前页面内存在轮播图像,则可以同时查看所有轮播图像以及这些轮播图像的相关属性;以第一页面元素为视频为例,则第一页面元素的属性信息例如为:视频的长、宽、播放时长、格式等属性;以第一页面元素为音频为例,则第一页面元素的属性信息例如为:音频的格式、播放时长等属性;以第一页面元素为文字为例,则第一页面元素的属性信息例如为:第一被访问页面的文字数、段落数等等。
通过上述方案,达到了能够方便的提供各个页面元素的属性信息的技术效果。
第二方面,基于同一发明构思,本发明实施例提供一种用于网络访问的装置,请参考图3,包括:
检测模块30,用于检测获得访问第一网络链接的访问操作;
响应模块31,用于响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取模块32,用于获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
可选的,所述获取模块32,具体用于:
遍历所述第一被访问页面的文档对象化模型DOM树;从所述DOM树中识别出所述至少一个类别的页面元素;或者
在进行网页文档解析的过程中,基于生成DOM树过程中所确定出的各个页面元素的类别统计出所述至少一个类别的页面元素。
可选的,所述获取模块32,具体用于:
通过各个页面元素的标签信息确定出对应页面元素的类别信息,进而提取所述至少一个类别的页面元素;或者
通过各个页面元素的网络链接的后缀名确定出对应页面元素的类别信息,进而获得所述至少一个类别的页面元素。
可选的,所述至少一个类别具体包括:文字类别、图像类别、视频类别、音频类别、链接类别中的至少一个类别。
可选的,所述获取模块32,还包括:
判断单元,用于判断所述链接类别下的每个链接信息是否包含特定字符;
加入单元,用于在第一链接信息包含所述特定字符时,将所述第一链接信息加入所述特定字符所对应的类别。
可选的,所述装置还包括:
判断模块,用于判断当前装置是否接收到预设操作,所述预设操作具体为:点击预设按钮、触发弹出菜单中的至少一种操作;
所述获取模块32,具体用于:在检测到所述预设操作时,提取所述至少一个类别的页面元素。
可选的,所述获取模块32,具体用于:
在从网络服务器获取所述第一被访问页面之后,从所述第一被访问页面提取所述至少一个类别的页面元素;或者
从网络服务器获取预存的所述第一被访问页面所包含的至少一个类别的页面元素。
可选的,所述装置还包括:
提示模块,用于对所述第一被访问页面中处于隐藏状态的页面元素进行提示。
可选的,所述装置还包括:
排序模块,用于对每个类别下的页面元素按照第一预设规则进行排序;和/或
提取模块,用于从第一类别下提取出满足第二预设规则的页面元素,所述第一类别具体为所述至少一个类别中的任一类别;和/或
第一确定模块,用于确定出第二类别下的页面元素的统计特征信息,所述第二类别具体为所述至少一个类别中的任一类别;和/或
第二确定模块,用于确定出第一页面元素的属性信息,所述第一页面元素为所述至少一个类别中的任一页面元素。
由于本发明第二方面所介绍的装置,为实施本发明实施例第一方面所介绍的用于网络访问的方法所采用的装置,基于本发明实施例第一方面所介绍的用于网络访问的方法,本领域所属技术人员能够了解本发明实施例第二方面所介绍的装置的具体结构及变形,故而在此不再赘述,凡是实施本发明实施例第一方面所介绍的用于网络访问的方法所采用的装置都属于本发明所欲保护的范围。
第三方面,基于同一发明构思,本发明实施例提供一种终端设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
检测获得访问第一网络链接的访问操作;
响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
遍历所述第一被访问页面的文档对象化模型DOM树;从所述DOM树中识别出所述至少一个类别的页面元素;或者
在进行网页文档解析的过程中,基于生成DOM树过程中所确定出的各个页面元素的类别统计出所述至少一个类别的页面元素。
可选的,所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在从网络服务器获取所述第一被访问页面之后,从所述第一被访问页面提取所述至少一个类别的页面元素;或者
从网络服务器获取预存的所述第一被访问页面所包含的至少一个类别的页面元素。
可选的,所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对所述第一被访问页面中处于隐藏状态的页面元素进行提示。
由于本发明第三方面所介绍的终端设备,为实施本发明实施例第一方面所介绍的用于网络访问的方法所采用的终端设备,基于本发明实施例第一方面所介绍的用于网络访问的方法,本领域所属技术人员能够了解本发明实施例第三方面所介绍的终端设备的具体结构及变形,故而在此不再赘述,凡是实施本发明实施例第一方面所介绍的用于网络访问的方法所采用的终端设备都属于本发明所欲保护的范围。
关于上述实施例中的终端设备,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种用于网络访问的方法的终端设备800的框图。例如,终端设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,终端设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制终端设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在终端设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为终端设备800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为终端设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述终端设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当终端设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当终端设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为终端设备800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为终端设备800的显示器和小键盘,传感器组件814还可以检测终端设备800或终端设备800一个组件的位置改变,用户与终端设备800接触的存在或不存在,终端设备800方位或加速/减速和终端设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于终端设备800和其他设备之间有线或无线方式的通信。终端设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,终端设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由终端设备800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行一种用于网络访问的方法,所述方法包括:
检测获得访问第一网络链接的访问操作;
响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
图5是本发明实施例中网络服务器的结构示意图。该网络服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对网络服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在网络服务器1900上执行存储介质1930中的一系列指令操作。
网络服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本发明一个或多个实施例,至少具有以下有益效果:
由于在本发明实施例中,首先检测获得访问第一网络链接的访问操作;然后响应所述访问操作,确定所述第一网络链接所对应的第一被访问页面;最后,获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。由于检测到访问操作时,会获得第一被访问页面所对应的至少一个类别的页面元素,故而用户可以选择自己感兴趣的类别下的页面元素进行访问,从而达到了提高网络访问效率的技术效果。并且,让用户对当前页面的认识更加精确和全面,有效防止发生遗漏网页信息的问题。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种用于网络访问的方法,其特征在于,包括:
检测获得访问第一网络链接的访问操作;
响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
2.如权利要求1所述的方法,其特征在于,所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体包括:
遍历所述第一被访问页面的文档对象化模型DOM树;从所述DOM树中识别出所述至少一个类别的页面元素;或者
在进行网页文档解析的过程中,基于生成DOM树过程中所确定出的各个页面元素的类别统计出所述至少一个类别的页面元素。
3.如权利要求2所述的方法,其特征在于,所述从所述DOM树中识别出所述至少一个类别的页面元素,具体包括:
通过各个页面元素的标签信息确定出对应页面元素的类别信息,进而提取所述至少一个类别的页面元素;或者
通过各个页面元素的网络链接的后缀名确定出对应页面元素的类别信息,进而获得所述至少一个类别的页面元素。
4.如权利要求1所述的方法,其特征在于,所述至少一个类别具体包括:文字类别、图像类别、视频类别、音频类别、链接类别中的至少一个类别。
5.如权利要求3所述的方法,其特征在于,所述从所述DOM树中识别出所述至少一个类别的页面元素,还包括:
判断所述链接类别下的每个链接信息是否包含特定字符;
在第一链接信息包含所述特定字符时,将所述第一链接信息加入所述特定字符所对应的类别。
6.如权利要求1-5任一所述的方法,其特征在于,在所述获取所述第一被访问页面所包含的至少一个类别的页面元素之前,所述方法还包括:
判断当前终端设备是否接收到预设操作,所述预设操作具体为:点击预设按钮、触发弹出菜单中的至少一种操作;
所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体为:在检测到所述预设操作时,提取所述至少一个类别的页面元素。
7.如权利要求1-5任一所述的方法,其特征在于,所述获取所述第一被访问页面所包含的至少一个类别的页面元素,具体包括:
在从网络服务器获取所述第一被访问页面之后,从所述第一被访问页面提取所述至少一个类别的页面元素;或者
从网络服务器获取预存的所述第一被访问页面所包含的至少一个类别的页面元素。
8.如权利要求1-5任一所述的方法,其特征在于,所述方法还包括:对所述第一被访问页面中处于隐藏状态的页面元素进行提示。
9.如权利要求1-5任一所述的方法,其特征在于,在所述获取所述第一被访问页面所包含的至少一个类别的页面元素之后,所述方法还包括:
对每个类别下的页面元素按照第一预设规则进行排序;和/或
从第一类别下提取出满足第二预设规则的页面元素,所述第一类别具体为所述至少一个类别中的任一类别;和/或
确定出第二类别下的页面元素的统计特征信息,所述第二类别具体为所述至少一个类别中的任一类别;和/或
确定出第一页面元素的属性信息,所述第一页面元素为所述至少一个类别中的任一页面元素。
10.一种用于网络访问的装置,其特征在于,包括:
检测模块,用于检测获得访问第一网络链接的访问操作;
响应模块,用于响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取模块,用于获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
11.一种终端设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
检测获得访问第一网络链接的访问操作;
响应所述访问操作,获取所述第一网络链接所对应的第一被访问页面;
获取所述第一被访问页面所包含的至少一个类别的页面元素,所述至少一个类别的页面元素由对所述第一被访问页面所包含的页面元素进行统计分析获得。
12.如权利要求11所述的终端设备,其特征在于,所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
遍历所述第一被访问页面的文档对象化模型DOM树;从所述DOM树中识别出所述至少一个类别的页面元素;或者
在进行网页文档解析的过程中,基于生成DOM树过程中所确定出的各个页面元素的类别统计出所述至少一个类别的页面元素。
13.如权利要求11或12所述的终端设备,其特征在于,所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在从网络服务器获取所述第一被访问页面之后,从所述第一被访问页面提取所述至少一个类别的页面元素;或者
从网络服务器获取预存的所述第一被访问页面所包含的至少一个类别的页面元素。
14.如权利要求11或12所述的终端设备,其特征在于,所述终端设备还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对所述第一被访问页面中处于隐藏状态的页面元素进行提示。
CN201510821183.8A 2015-11-23 2015-11-23 一种用于网络访问的方法、装置及终端设备 Pending CN106776634A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510821183.8A CN106776634A (zh) 2015-11-23 2015-11-23 一种用于网络访问的方法、装置及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510821183.8A CN106776634A (zh) 2015-11-23 2015-11-23 一种用于网络访问的方法、装置及终端设备

Publications (1)

Publication Number Publication Date
CN106776634A true CN106776634A (zh) 2017-05-31

Family

ID=58964237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510821183.8A Pending CN106776634A (zh) 2015-11-23 2015-11-23 一种用于网络访问的方法、装置及终端设备

Country Status (1)

Country Link
CN (1) CN106776634A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763544A (zh) * 2018-05-31 2018-11-06 维沃移动通信有限公司 一种显示方法及终端
CN110020361A (zh) * 2017-11-09 2019-07-16 北京搜狗科技发展有限公司 一种网页处理方法、装置、存储介质和电子设备
WO2024051439A1 (zh) * 2022-09-08 2024-03-14 北京有竹居网络技术有限公司 网页生成方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294711A (zh) * 2012-02-28 2013-09-11 阿里巴巴集团控股有限公司 一种确定网页中的页面元素的方法以及装置
CN104166545A (zh) * 2014-07-25 2014-11-26 北京搜狗科技发展有限公司 一种网页资源的嗅探方法以及装置
US20150142567A1 (en) * 2013-11-19 2015-05-21 Adobe Systems Incorporated Method and apparatus for identifying elements of a webpage
CN104794118A (zh) * 2014-01-17 2015-07-22 腾讯科技(深圳)有限公司 一种网页信息处理方法、装置和系统
CN104978373A (zh) * 2014-06-09 2015-10-14 腾讯科技(深圳)有限公司 网页展示方法及网页展示装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294711A (zh) * 2012-02-28 2013-09-11 阿里巴巴集团控股有限公司 一种确定网页中的页面元素的方法以及装置
US20150142567A1 (en) * 2013-11-19 2015-05-21 Adobe Systems Incorporated Method and apparatus for identifying elements of a webpage
CN104794118A (zh) * 2014-01-17 2015-07-22 腾讯科技(深圳)有限公司 一种网页信息处理方法、装置和系统
CN104978373A (zh) * 2014-06-09 2015-10-14 腾讯科技(深圳)有限公司 网页展示方法及网页展示装置
CN104166545A (zh) * 2014-07-25 2014-11-26 北京搜狗科技发展有限公司 一种网页资源的嗅探方法以及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020361A (zh) * 2017-11-09 2019-07-16 北京搜狗科技发展有限公司 一种网页处理方法、装置、存储介质和电子设备
CN108763544A (zh) * 2018-05-31 2018-11-06 维沃移动通信有限公司 一种显示方法及终端
WO2024051439A1 (zh) * 2022-09-08 2024-03-14 北京有竹居网络技术有限公司 网页生成方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN107256109B (zh) 信息显示方法、装置及终端
US9524714B2 (en) Speech recognition apparatus and method thereof
CN109614482B (zh) 标签的处理方法、装置、电子设备及存储介质
US10992622B2 (en) Method, terminal equipment and storage medium of sharing user information
RU2662632C2 (ru) Представление документов фиксированного формата в формате с измененной компоновкой
KR101855147B1 (ko) 사용자 선호도 분석 방법 및 그를 위한 디바이스
CN103959206A (zh) 用于动态适应虚拟键盘的方法和装置
EP3005055B1 (en) Apparatus and method for representing and manipulating metadata
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
CN108804469B (zh) 一种网页识别方法以及电子设备
CN112230838A (zh) 一种文章处理方法、装置、设备及计算机可读存储介质
CN114372172A (zh) 生成视频封面图像的方法、装置、计算机设备及存储介质
CN107895006A (zh) 音频播放方法、装置、存储介质及电子设备
CN110580486A (zh) 一种数据处理方法、装置、电子设备和可读介质
CN107622074A (zh) 一种数据处理方法、装置和计算设备
CN115357249A (zh) 一种代码生成方法、装置、电子设备及存储介质
CN108197105B (zh) 自然语言处理方法、装置、存储介质及电子设备
CN106776634A (zh) 一种用于网络访问的方法、装置及终端设备
CN110309324A (zh) 一种搜索方法及相关装置
CN107220371A (zh) 页面显示方法、装置及存储介质
CN108628870A (zh) 一种网页预览方法和装置
CN111460180B (zh) 信息显示方法、装置、电子设备及存储介质
CN108572980B (zh) 一种网页分屏显示方法和装置
CN112181252A (zh) 截屏方法、装置及电子设备
CN114745585B (zh) 字幕显示方法、装置、终端和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication