google appengine中的url routing

2010年03月4日 9:17 上午  |  分类:python

在做rss4py的过程中发现这样的一个问题 ,直到现在也没有找到良好的解决方案。

def main():
    webapp.template.register_template_library('filter')
    application = webapp.WSGIApplication(
                                       [
                                        (r'/member/(?P<site>[0-9]+)/?', Main),
                                        (r'/member/(?P<site>[0-9]+)/page/(?P<page>[0-9]+)/?', Main),
                                        (r'/page/(?P<page>[0-9]*)/?', Main),
                                        ('.*',Error404),
                                       ], debug=True)
    wsgiref.handlers.CGIHandler().run(application)

if __name__ == "__main__":
    main()

在这里,有三种符合匹配条件的url被交给Main controller去处理,即:

  1. /member/1                                 成员ID为1的记录
  2. /member/1/page/2                成员ID为1的第2页记录
  3. /page/1                                         所有成页的第1页记录

Main Controller:

class Main():
    def get(self,site = 0,page=1):
        self.write('site : %s' % site)
        self.write('<br />page: %s' % page)
        return

当访问/member/1/时,输出:site:1 page:1
访问/member/1/page/2/ 时,输出: site:1 page:2
访问/page/3 时,输出:site:3 page:1
可以看出,前面二个URL的区配都是正确的,但第3个是错误的,需要的输出是:site:0 page:3,很明显,3被当成参数site被传递了,
如果单纯交换Main/get方法中site/page参数的顺序的话,第三个URL匹配正确,第一、二个就不正确了。

方案1:将URL规则做如下修改:

def main():
    webapp.template.register_template_library('filter')
    application = webapp.WSGIApplication(
                                       [
                                       (r'/(?P<site>member/[0-9]+)/?', Main),
                                       (r'/(?P<site>member/[0-9]+)/(?P<page>page/[0-9]+)/?', Main),
                                       (r'/(?P<page>page/[0-9]*)/?', Main),
                                       ], debug=True)
    wsgiref.handlers.CGIHandler().run(application)

if __name__ == "__main__":
    main()

修改后的URL规则中将member/page都做为参数传递到Main的get方法中,即访问/member/1/page/5时,get方法中的site参数值为member/1,page参数值为page/5,这样轻易分析一下就能得到正确的site/page值。

方案2:一个URL规则搞定:

(?:/member/(?P<site>[0-9]+))?(?:/page/?(?P<page>[0-9]+))?/?

这个正则太狠了

臭蛋聚测试版发布

2010年02月25日 11:13 上午  |  分类:python

臭蛋聚是一个RSS聚合器,构建在Google App Engine上的,写的这个小应用是用来取代原有的feed.yibin001.com(和谐了)。

有段时间没写gae的小应用了,刚开始时还显得有点陌生,在此期间也遇到一些小问题,在这里一并写出来,希望对初次开发gae应用的朋友有一个帮助。

  1. gae datastore,在gae中,所有Gql的排序字段都是需要建索引的,否则会出现经典的”NeedIndexError: no matching index found.”错误,附在错误后面的信息就是需要建立的索引,你可以复制下来,然后粘帖到index.yaml文件,并上传。上传后并不能马上使用,gae需要一个build的过程,这个时间长短要看数据量的大小,索引状态变成Serving时就意味着索引已创建成功。
  2. Gql查询结果排序问题。排序的字段要有值,不能为None,否则结果集可能不是你所需要的。如:SELECT * FROM Feeds ORDER BY LastPubDate DESC,如果此时的LastPubDate都没有值,即使有10条数据,这条查询无法返回记录的。
  3. 对于GMT(rfc822)时间格式的解析。按rss标准,PubDate正确格式应该是Sat, 20 Feb 2010 07:04:52 +0000,直接用datetime模块解析不是很方便,可以用rfc822模块中的parsedate_tz函数进行转换。对于非标准GMT(rfc822)格式的时间,只能配合正则进行解析。

最后,臭蛋聚的地址为:http://rss4py.appspot.com/

album4gae及imagespider版本更新

2010年02月19日 6:48 下午  |  分类:没有分类

album4gae没有做较大的调整,后台图片上传改用swfupload的批量上传,单个文件同样受gae的限制,不能超过1M。

上传成功后的预览:

前台演示:

http://album4gae.appspot.com

imagespider增加对image.google.cn的搜索支持,图片保存在程序目录/download/搜索关键字下,目录安排更为合理。

album4gae请到这里下载:

http://code.google.com/p/album4gae/downloads/list

imagespider下载:

http://www.yibin001.com/files/imagespider.rar

遍历Memcached服务器的KEY列表

2009年11月25日 4:58 下午  |  分类:Develop

Memcached.ClientLibrary没有提供获取所有缓存KEY的方法,但有时候,我们又需要得知当前Memcached服务器上有哪些缓存key。

于是,我修改了Memcached.ClientLibrary源代码,实现了该需求。

主要通过发送stats items命令和stats cachedump x x来实现,可以先telnet上去看看

ScreenShot00068

摸黑输入 stats items回车

ScreenShot00069

继续阅读 »

Pages: 1 2 3 4 5 6 7 ...111 112 113 »