搜索
有爱,有技术,有你^_^)y
╱人◕‿‿◕人╲订下契约(注册新用户)

合作站点账号登陆

QQ登录

只需一步,快速开始

快捷导航
查看: 1072|回复: 14
收起左侧

[算法设计] 想做一个程序,有没有人知道咋整。。。。。

 关闭 [复制链接]

该用户从未签到

3

主题

1

好友

986

积分

New Game

积分
986
发表于 2013-2-11 16:37:33 | 显示全部楼层 |阅读模式

╱人◕‿‿◕人╲定下契约

您需要 登录 才可以下载或查看,没有账号?╱人◕‿‿◕人╲订下契约(注册新用户)

x
一个用来查询资料的程序。。。。。。。我主要想用在伪春菜上的。。。。程序的大致内容就是接收伪春菜从我们那获得的一个词,然后交由百度百科查到相应词条,将内容用伪春菜的窗口反馈给使用者。。。。。。就像个度娘的客户端一样,只不过是交由伪春菜完成查询,不用浏览器什么的。。。。。我觉得关键应该在网页代码上,不管是开头将单词交给百度查询还是得到结果后剔除网页源代码中的无用信息都和网页代码有关。。。。但我找不到地方下手。。。。。。。。有没有大虾知道,求指点。。。。。。。。。。


                               
登录/注册后可看大图
该贴已经同步到 张泽豪的微博
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复

使用道具 举报

该用户从未签到

3

主题

50

好友

5293

积分

序章

积分
5293
发表于 2013-2-11 16:42:05 | 显示全部楼层
比较有效的方法要用百科的api
可惜不开放
http://baike.baidu.com/hezuo/api.html
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

该用户从未签到

3

主题

1

好友

986

积分

New Game

积分
986
 楼主| 发表于 2013-2-11 16:49:56 | 显示全部楼层
所以我才想做个程序,不需要百度的合作。。。。。。。。我以前用易语言编程随便用超链接窗口做过一个很差的浏览器,我想的就是能不能做个类似于浏览器的东西。。。。只要输入一个词,他就交给百度百科查找,而得到的百度百科页面会以网页代码的形式返回我们的这个超链接窗口(就像网页浏览器一样),然后就只用剔除网页源代码的无用信息了。。。。。。。。
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

该用户从未签到

13

主题

29

好友

5784

积分

序章

积分
5784
发表于 2013-2-11 20:21:31 | 显示全部楼层
可以用iframe,直接百科查词,然后显示在iframe窗口。
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

该用户从未签到

7

主题

21

好友

8661

积分

技术宅认证程序员

echo 'hehe'; die();

积分
8661
发表于 2013-2-12 01:34:08 来自手机 | 显示全部楼层
用PHP目测挺简单
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

签到天数: 1 天

连续签到: 1 天

[LV.1]初来乍到

10

主题

9

好友

2511

积分

Continue

积分
2511
发表于 2013-2-13 14:27:15 | 显示全部楼层
浏览器控件可以取html源码的吧?取源码自行删减。。

点评

....  发表于 2013-2-13 15:31
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

该用户从未签到

3

主题

37

好友

1万

积分

第一章

积分
11825
发表于 2013-2-14 19:50:02 | 显示全部楼层
同意楼上,感觉http请求获取html后用正则表达式匹配就行?这个场景应该不太要求性能的吧。
如果是前端应该就更简单了,直接javascript操作dom就行了。

我也没细想,仅供参考哦。
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

该用户从未签到

15

主题

23

好友

6718

积分

序章

积分
6718
发表于 2013-2-14 22:32:09 | 显示全部楼层
同意楼上
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

该用户从未签到

5

主题

1

好友

1039

积分

Continue

积分
1039
发表于 2013-2-16 14:45:35 | 显示全部楼层
你们这些人够了
楼主先找找xmlhttp的用法
然后用他获取百科页面的源代码
http://baike.baidu.com/list-php/dispose/searchword.php?word=+被urlencode编码过的查找关键字+&pic=1
urlencode一般现在的编程语音都有这个函数
得到页面的源代码之后LZ你要懂正则表达式或者字符串处理
正则表达式不能速成,但是字符串处理可以速成
我给你用VB写个函数
    Function instrexa(ByVal fulltext As String, ByVal left As String, ByVal right As String) As String
        Dim lswz, length As Integer, lstr As String
        length = Len(fulltext)
        lswz = InStr(fulltext, left) + Len(left)
        lstr = Mid(fulltext, lswz, length)
        length = Len(lstr)
        lswz = InStr(lstr, right) - 1
        lstr = Mid(lstr, 1, lswz)
        Return lstr
    End Function
fulltext代表源代码
left表示你要取得的内容左边部分
right表示你要取得的内容右边部分
html代码都有标记的 你可以看看
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

签到天数: 1 天

连续签到: 1 天

[LV.1]初来乍到

10

主题

9

好友

2511

积分

Continue

积分
2511
发表于 2013-2-16 18:51:32 | 显示全部楼层
ivydom 发表于 2013-2-16 14:45
你们这些人够了
楼主先找找xmlhttp的用法
然后用他获取百科页面的源代码

VB不是用Return返回的
倒数第二行改下
        Return lstr
改成:
instrexa=lstr
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

该用户从未签到

5

主题

1

好友

1039

积分

Continue

积分
1039
发表于 2013-2-16 19:22:51 | 显示全部楼层
o70078 发表于 2013-2-16 18:51
VB不是用Return返回的
倒数第二行改下
        Return lstr

拜托 效果都是一样的
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

签到天数: 1 天

连续签到: 1 天

[LV.1]初来乍到

3

主题

12

好友

7526

积分

LOLI控

积分
7526
发表于 2013-2-19 18:16:11 | 显示全部楼层
本帖最后由 jinlei6394 于 2013-2-19 18:17 编辑

模拟浏览器行为吗?
如果是可以看看HTML协议。
收到你们公司的包以后,
模拟一个用户去查百科的行为发包给百度。
将回馈的信息显示在客户终端。
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

签到天数: 1 天

连续签到: 1 天

[LV.1]初来乍到

10

主题

9

好友

2511

积分

Continue

积分
2511
发表于 2013-2-20 18:30:56 | 显示全部楼层
ivydom 发表于 2013-2-16 19:22
拜托 效果都是一样的

阿勒,是这样么,那对不起了,请原谅我的无知,前辈~
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

签到天数: 1 天

连续签到: 1 天

[LV.1]初来乍到

5

主题

13

好友

5241

积分

序章

积分
5241
发表于 2013-2-20 21:12:00 | 显示全部楼层
围观
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

该用户从未签到

1

主题

2

好友

426

积分

New Game

积分
426
发表于 2013-2-28 17:52:35 | 显示全部楼层
API不开放的话就直接用Python抓页面, 然后过滤返回值:
用到的工具:
* requests
* PyQuery
签名被小宅喵吞掉了~~~~(>_<)~~~~
回复 支持 反对

使用道具 举报

本版积分规则

小黑屋|手机版|技术宅(Z站|基宅) ( 粤ICP备18082987号-1 )

GMT+8, 2025-6-18 15:19 , Processed in 0.164662 second(s), 40 queries , Redis On.

Copyright © 2018 技术宅社区

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表