PhpDocumentor中文乱码解决办法

Posted on 2012年3月20日 16:27

根据PEAR手册上所说:

File Formats
All scripts contributed to PEAR must:

Be stored as ASCII text

Use ISO-8859-1 character encoding

Be Unix formatted

“Unix formatted” means two things:

1) Lines must end only with a line feed (LF). Line feeds are represented as ordinal 10, octal 012 and hex 0A. Do not use carriage returns (CR) like Macintosh computers do or the carriage return/line feed combination (CRLF) like Windows computers do.

2) There should be one line feed after the closing PHP tag (?>). This means that when the cursor is at the very end of the file, it should be one line below the closing PHP tag.

解决办法比较机械:
PhpDocumentor/phpDocumentor/Converters/HTML/frames/templates/ 目录下面所有模板文件:
iso-8859-1替换成utf-8

相关编码知识:
ISO 8859-1,正式编号为ISO/IEC 8859-1:1998,又称Latin-1或“西欧语言”,是国际标准化组织内ISO/IEC 8859的第一个8位字符集。

 

本文转自:http://ihacklog.com/software/development-tool/phpdocumentor-chinese-words.html

PHP实现异步调用方法研究

Posted on 2012年3月19日 23:53

浏览器和服务器之间是通过 HTTP 协议进行连接通讯的。这是一种基于请求和响应模型的协议。浏览器通过 URL 向服务器发起请求,Web 服务器接收到请求,执行一段程序,然后做出响应,发送相应的html代码给客户端。

这就有了一个问题,Web 服务器执行一段程序,可能几毫秒就完成,也可能几分钟都完不成。如果程序执行缓慢,用户可能没有耐心等下去,就关闭浏览器了。

而有的时候,我们更本不关心这些耗时的脚本的返回结果,但却还要等他执行完返回,才能继续下一步。
那么有没有什么办法,只是简单的触发调用这些耗时的脚本然后就继续下一步,让这些耗时的脚本在服务端慢慢执行?

经过试验,总结出来几种方法,和大家share:
1. 最简单的办法,就是在返回给客户端的HTML代码中,嵌入AJAX调用,或者,嵌入一个img标签,src指向要执行的耗时脚本。
这种方法最简单,也最快。服务器端不用做任何的调用。
但是缺点是,一般来说Ajax都应该在onLoad以后触发,也就是说,用户点开页面后,就关闭,那就不会触发我们的后台脚本了。
而使用img标签的话,这种方式不能称为严格意义上的异步执行。用户浏览器会长时间等待php脚本的执行完成,也就是用户浏览器的状态栏一直显示还在load。
当然,还可以使用其他的类似原理的方法,比如script标签等等。

2. popen()

resource popen ( string command, string mode );
//打开一个指向进程的管道,该进程由派生给定的 command 命令执行而产生。打开一个指向进程的管道,该进程由派生给定的 command 命令执行而产生。

所以可以通过调用它,但忽略它的输出。

  1. pclose(popen("/home/xinchen/backend.php &", 'r'));

这个方法避免了第一个方法的缺点,并且也很快。但是问题是,这种方法不能通过HTTP协议请求另外的一个WebService,只能执行本地的脚本文件。并且只能单向打开,无法穿大量参数给被调用脚本。 并且如果,访问量很高的时候,会产生大量的进程。如果使用到了外部资源,还要自己考虑竞争。

3. 使用CURL 这个方法,设置CUROPT_TIMEOUT为1(最小为1,郁闷)。也就是说,客户端至少必须等待1秒钟。

  1. $ch = curl_init();
  2.  
  3. $curl_opt = array(CURLOPT_URL, 'http://www.example.com/backend.php',
  4.                             CURLOPT_RETURNTRANSFER, 1,
  5.                             CURLOPT_TIMEOUT, 1,);
  6.  
  7. curl_setopt_array($ch, $curl_opt);
  8.  
  9. curl_exec($ch);
  10.  
  11. curl_close($ch);

4. 使用fsockopen 这个方法应该是最完美的,但是缺点是,你需要自己拼出HTTP的header部分。

  1. $fp = fsockopen("www.example.com", 80, $errno, $errstr, 30);
  2. if (!$fp) {
  3.     echo "$errstr ($errno)<br />\n";
  4. } else {
  5.     $out = "GET /backend.php / HTTP/1.1\r\n";
  6.     $out .= "Host: www.example.com\r\n";
  7.     $out .= "Connection: Close\r\n\r\n";
  8.  
  9.     fwrite($fp, $out);
  10.     /*忽略执行结果
  11. while (!feof($fp)) {
  12. echo fgets($fp, 128);
  13. }*/
  14.     fclose($fp);
  15. }

所以,总体来看,最好用,最简单的还是第一种方法。 最完美的应该是最后一种,但是比较复杂

 

本文转自:http://www.laruence.com/2008/04/14/318.html

optparse

Posted on 2012年3月13日 22:11

Python 有两个内建的模块用于处理命令行参数:

一个是 getopt,《Deep in python》一书中也有提到,只能简单处理 命令行参数;

另一个是 optparse,它功能强大,而且易于使用,可以方便地生成标准的、符合Unix/Posix 规范的命令行说明。

示例

下面是一个使用 optparse 的简单示例:

Python代码 
  1. from optparse import OptionParser  
  2. [...]  
  3. parser = OptionParser()  
  4. parser.add_option("-f""--file", dest="filename",  
  5.                   help="write report to FILE", metavar="FILE")  
  6. parser.add_option("-q""--quiet",  
  7.                   action="store_false", dest="verbose", default=True,  
  8.                   help="don't print status messages to stdout")  
  9.   
  10. (options, args) = parser.parse_args()  
 

现在,妳就可以在命令行下输入:

Python代码 
  1. <yourscript> --file=outfile -q  
  2. <yourscript> -f outfile --quiet  
  3. <yourscript> --quiet --file outfile  
  4. <yourscript> -q -foutfile  
  5. <yourscript> -qfoutfile  
 

上面这些命令是相同效果的。除此之外, optparse 还为我们自动生成命令行的帮助信息:

Python代码 
  1. <yourscript> -h  
  2. <yourscript> --help  
 

输出:

Python代码 
  1. usage: <yourscript> [options]  
  2.   
  3. options:  
  4.   -h, --help            show this help message and exit  
  5.   -f FILE, --file=FILE  write report to FILE  
  6.   -q, --quiet           don't print status messages to stdout  
 

 

简单流程

首先,必须 import OptionParser 类,创建一个 OptionParser 对象:

Python代码 
  1. from optparse import OptionParser  
  2.   
  3. [...]  
  4.   
  5. parser = OptionParser()  
 

然后,使用 add_option 来定义命令行参数:

Python代码 
  1. parser.add_option(opt_str, ...,  
  2.   
  3.                   attr=value, ...)  
 

每个命令行参数就是由参数名字符串和参数属性组成的。如 -f 或者 –file 分别是长短参数名:

Python代码 
  1. parser.add_option("-f""--file", ...)  
 

最后,一旦你已经定义好了所有的命令行参数,调用 parse_args() 来解析程序的命令行:

Python代码 
  1. (options, args) = parser.parse_args()  
 

注: 你也可以传递一个命令行参数列表到 parse_args();否则,默认使用 sys.argv[:1]。

parse_args() 返回的两个值:

  • options,它是一个对象(optpars.Values),保存有命令行参数值。只要知道命令行参数名,如 file,就可以访问其对应的值: options.file 。
  • args,它是一个由 positional arguments 组成的列表。

Actions

action 是 parse_args() 方法的参数之一,它指示 optparse 当解析到一个命令行参数时该如何处理。actions 有一组固定的值可供选择,默认是’store ‘,表示将命令行参数值保存在 options 对象里。

示例

Python代码 
  1. parser.add_option("-f""--file",  
  2.                   action="store", type="string", dest="filename")  
  3. args = ["-f""foo.txt"]  
  4. (options, args) = parser.parse_args(args)  
  5. print options.filename  
 

最后将会打印出 “foo.txt”。

当 optparse 解析到’-f’,会继续解析后面的’foo.txt’,然后将’foo.txt’保存到 options.filename 里。当调用 parser.args() 后,options.filename 的值就为’foo.txt’。

你也可以指定 add_option() 方法中 type 参数为其它值,如 int 或者 float 等等:

Python代码 
  1. parser.add_option("-n", type="int", dest="num")  
 

默认地,type 为’string’。也正如上面所示,长参数名也是可选的。其实,dest 参数也是可选的。如果没有指定 dest 参数,将用命令行的参数名来对 options 对象的值进行存取。

store 也有其它的两种形式: store_true 和 store_false ,用于处理带命令行参数后面不 带值的情况。如 -v,-q 等命令行参数:

Python代码 
  1. parser.add_option("-v", action="store_true", dest="verbose")  
  2. parser.add_option("-q", action="store_false", dest="verbose")  
 

这样的话,当解析到 ‘-v’,options.verbose 将被赋予 True 值,反之,解析到 ‘-q’,会被赋予 False 值。

其它的 actions 值还有:

store_const 、append 、count 、callback 。

 

默认值

parse_args() 方法提供了一个 default 参数用于设置默认值。如:

Python代码 
  1. parser.add_option("-f","--file", action="store", dest="filename", default="foo.txt")  
  2. parser.add_option("-v", action="store_true", dest="verbose", default=True)  
 

又或者使用 set_defaults():

Python代码 
  1. parser.set_defaults(filename="foo.txt",verbose=True)  
  2. parser.add_option(...)  
  3. (options, args) = parser.parse_args()  
 

 

生成程序帮助

optparse 另一个方便的功能是自动生成程序的帮助信息。你只需要为 add_option() 方法的 help 参数指定帮助信息文本:

Python代码 
  1. usage = "usage: %prog [options] arg1 arg2"  
  2. parser = OptionParser(usage=usage)  
  3. parser.add_option("-v""--verbose",  
  4.                   action="store_true", dest="verbose", default=True,  
  5.                   help="make lots of noise [default]")  
  6. parser.add_option("-q""--quiet",  
  7.                   action="store_false", dest="verbose",  
  8.                   help="be vewwy quiet (I'm hunting wabbits)")  
  9. parser.add_option("-f""--filename",  
  10.                   metavar="FILE", help="write output to FILE"),  
  11. parser.add_option("-m""--mode",  
  12.                   default="intermediate",  
  13.               help="interaction mode: novice, intermediate, "  
  14.                    "or expert [default: %default]")  
 

当 optparse 解析到 -h 或者 –help 命令行参数时,会调用 parser.print_help() 打印程序的帮助信息:

Python代码 
  1. usage: <yourscript> [options] arg1 arg2  
  2.   
  3. options:  
  4.   -h, --help            show this help message and exit  
  5.   -v, --verbose         make lots of noise [default]  
  6.   -q, --quiet           be vewwy quiet (I'm hunting wabbits)  
  7.   -f FILE, --filename=FILE  
  8.                         write output to FILE  
  9.   -m MODE, --mode=MODE  interaction mode: novice, intermediate, or  
  10.                         expert [default: intermediate]  
 

注意: 打印出帮助信息后,optparse 将会退出,不再解析其它的命令行参数。

以上面的例子来一步步解释如何生成帮助信息:

  • 自定义的程序使用方法信息(usage message):

    Python代码 
    1. usage = "usage: %prog [options] arg1 arg2"  
     

    这行信息会优先打印在程序的选项信息前。当中的 %prog,optparse 会以当前程序名的字符串来替代:如 os.path.basename.(sys.argv[0])。

    如果用户没有提供自定义的使用方法信息,optparse 会默认使用: “usage: %prog [options]”。

  • 用户在定义命令行参数的帮助信息时,不用担心换行带来的问题,optparse 会处理好这一切。

  • 设置 add_option 方法中的 metavar 参数,有助于提醒用户,该命令行参数所期待的参数,如 metavar=“mode”:

    Python代码 
    1. -m MODE, --mode=MODE  
     

    注意: metavar 参数中的字符串会自动变为大写。

  • 在 help 参数的帮助信息里使用 %default 可以插入该命令行参数的默认值。

如果程序有很多的命令行参数,你可能想为他们进行分组,这时可以使用 OptonGroup:

Python代码 
  1. group = OptionGroup(parser, ``Dangerous Options'',  
  2.                     ``Caution: use these options at your own risk.  ``  
  3.                     ``It is believed that some of them bite.'')  
  4. group.add_option(``-g'', action=''store_true'', help=''Group option.'')  
  5. parser.add_option_group(group)  
 

下面是将会打印出来的帮助信息:

Python代码 
  1. usage:  [options] arg1 arg2  
  2.   
  3. options:  
  4.   -h, --help           show this help message and exit  
  5.   -v, --verbose        make lots of noise [default]  
  6.   -q, --quiet          be vewwy quiet (I'm hunting wabbits)  
  7.   -fFILE, --file=FILE  write output to FILE  
  8.   -mMODE, --mode=MODE  interaction mode: one of 'novice''intermediate'  
  9.                        [default], 'expert'  
  10.   
  11.   Dangerous Options:  
  12.     Caution: use of these options is at your own risk.  It is believed that  
  13.     some of them bite.  
  14.     -g                 Group option.  
 

 

显示程序版本

象 usage message 一样,你可以在创建 OptionParser 对象时,指定其 version 参数,用于显示当前程序的版本信息:

Python代码 
  1. parser = OptionParser(usage="%prog [-f] [-q]", version="%prog 1.0")  
 

这样,optparse 就会自动解释 –version 命令行参数:

Python代码 
  1. $ /usr/bin/foo --version  
  2. foo 1.0  
 

 

处理异常

包括程序异常和用户异常。这里主要讨论的是用户异常,是指因用户输入无效的、不完整的命令行参数而引发的异常。optparse 可以自动探测并处理一些用户异常:

Python代码 
  1. $ /usr/bin/foo -n 4x  
  2. usage: foo [options]  
  3.   
  4. foo: error: option -n: invalid integer value: '4x'  
  5.   
  6. $ /usr/bin/foo -n  
  7. usage: foo [options]  
  8.   
  9. foo: error: -n option requires an argument  
 

用户也可以使用 parser.error() 方法来自定义部分异常的处理:

Python代码 
  1. (options, args) = parser.parse_args()  
  2. [...]  
  3. if options.a and options.b:  
  4.     parser.error("options -a and -b are mutually exclusive")  
 

上面的例子,当 -b 和 -b 命令行参数同时存在时,会打印出“options -a and -b are mutually exclusive“,以警告用户。

如果以上的异常处理方法还不能满足要求,你可能需要继承 OptionParser 类,并重载 exit() 和 erro() 方法。

 

完整的程序例子

Python代码 
  1. from optparse import OptionParser  
  2. [...]  
  3. def main():  
  4.     usage = "usage: %prog [options] arg"  
  5.     parser = OptionParser(usage)  
  6.     parser.add_option("-f""--file", dest="filename",  
  7.                       help="read data from FILENAME")  
  8.     parser.add_option("-v""--verbose",  
  9.                       action="store_true", dest="verbose")  
  10.     parser.add_option("-q""--quiet",  
  11.                       action="store_false", dest="verbose")  
  12.     [...]  
  13.     (options, args) = parser.parse_args()  
  14.     if len(args) != 1:  
  15.         parser.error("incorrect number of arguments")  
  16.     if options.verbose:  
  17.         print "reading %s..." % options.filename  
  18.     [...]  
  19.   
  20. if __name__ == "__main__":  
  21.     main()  
 

参考资料

 

sys.getrefcount() 获取对象的当前引用计数

Posted on 2012年3月07日 03:28

>>> a = 37
>>> import sys
>>> sys.getrefcount(a)
10
>>>
 

多数情况下,引用技术比你猜测得要大得多。对于不可变数据(如数字和字符串),解释器会主动在程序的不同部分共享对象,以便节约内存。

用mount挂载远程服务器网络硬盘

Posted on 2012年3月06日 20:01

环境:

服务器:192.168.20.204

客户端:192.168.20.203

1. 在服务器配置/etc/export  添加可以共享的文件夹和允许的客户端地址

/home/dir 192.168.20.203(rw,no_root_squash,async)

要加上no_root_squash,async,不然会出现reason given by server: Permission denied

重启nfs服务器

service nfs restart

2. 在客户端运行

mkdir -p /mnt/dir    创建挂载点

mount -t nfs 192.168.20.204:/home/dir /home/dir

一定要先创建挂载点,不然会出现mount point does not exist的错误

3. RPC Error: Program not registered错误

服务没启动。。

运行service nfs restart

 

Python将工作分布到多个线程

Posted on 2012年3月04日 03:50

使用threading

 

#!/usr/bin/env python3

import optparse
import os
import queue
import threading

BLOCK_SIZE = 8000

class Worker(threading.Thread):
    
    def __init__(self, work_queue, word, number):
        super().__init__()
        self.work_queue = work_queue
        self.word = word
        self.number = number 

    def run(self):
        while True:
            try:
                filename = self.work_queue.get()
                self.process(filename)
            finally:
                self.work_queue.task_done()
    
    def process(self, filename):
        previous = ""
        try:
            with open(filename, "rb") as fh:
                while True:
                    current = fh.read(BLOCK_SIZE)
                    if not current:
                        break
                    current = current.decode("utf8", "ignore")
                    if (self.word in current or
                        self.word in previous[-len(self.word):] +
                                     current[:len(self.word)]):
                        print("{0}{1}".format(self.number, filename))
                        break
                    if len(current) != BLOCK_SIZE:
                        break
                    previous = current
        except EnvironmentError as err:
            print("{0}{1}".format(self.number, err))

    
def main():
    opts, word, args = parse_options()
    filelist = get_files(args, opts.recurse)
    work_queue = queue.Queue()
    for i in range(opts.count):
        number = "{0}: ".format(i + 1) if opts.debug else ""
        worker = Worker(work_queue, word, number)
        worker.daemon = True
        worker.start()
    for filename in filelist:
        work_queue.put(filename)
    work_queue.join()
        

def parse_options():
    parser = optparse.OptionParser(
            usage=("usage: %prog [options] word name1 "
                   "[name2 [... nameN]\n\n"
                   "names are filenames or paths: paths only "
                   "make sense with the -r option set"))
    parser.add_option("-t", "--threads", dest="count", default=7,
            type="int",
            help=("the number of threads to use(1..20) "
                  "[default %default]"))
    parser.add_option("-r", "--recurse", dest="recurse",
            default=False, action="store_true",
            help="recurse into subdirectories")
    parser.add_option("-d", "--debug", dest="debug", default=False,
                    action="store_true")
    opts, args = parser.parse_args()
    if len(args) == 0:
        parser.error("a word and at least one path must be specified")
    elif len(args) == 1:
        parser.error("at least one path must be specified")
    if (not opts.recurse and
        not any([os.path.isfile(arg) for arg in args])):
        parser.add("at least one file must be specified: or use -r")
    if not (1 <= opts.count <=20):
        parser.error("thread count must be 1..20")
    return opts, args[0], args[1:]

def get_files(args, recurse):
    filelist = []
    for path in args:
        if os.path.isfile(path):
            filelist.append(path)
        elif recurse:
            for root, dirs, files in os.walk(path):
                for filename in files:
                    filelist.append(os.path.join(root, filename))
    return filelist

main()

 

使用multiprocessing

#!/usr/bin/env python3

import optparse
import os
import multiprocessing

BLOCK_SIZE = 8000

class Worker(multiprocessing.Process):
    
    def __init__(self, work_queue, word, number):
        super().__init__()
        self.work_queue = work_queue
        self.word = word
        self.number = number 

    def run(self):
        while True:
            try:
                filename = self.work_queue.get()
                self.process(filename)
            finally:
                self.work_queue.task_done()
    
    def process(self, filename):
        previous = ""
        try:
            with open(filename, "rb") as fh:
                while True:
                    current = fh.read(BLOCK_SIZE)
                    if not current:
                        break
                    current = current.decode("utf8", "ignore")
                    if (self.word in current or
                        self.word in previous[-len(self.word):] +
                                     current[:len(self.word)]):
                        print("{0}{1}".format(self.number, filename))
                        break
                    if len(current) != BLOCK_SIZE:
                        break
                    previous = current
        except EnvironmentError as err:
            print("{0}{1}".format(self.number, err))

    
def main():
    opts, word, args = parse_options()
    filelist = get_files(args, opts.recurse)
    work_queue = multiprocessing.JoinableQueue()
    for i in range(opts.count):
        number = "{0}: ".format(i + 1) if opts.debug else ""
        worker = Worker(work_queue, word, number)
        worker.daemon = True
        worker.start()
    for filename in filelist:
        work_queue.put(filename)
    work_queue.join()
        

def parse_options():
    parser = optparse.OptionParser(
            usage=("usage: %prog [options] word name1 "
                   "[name2 [... nameN]\n\n"
                   "names are filenames or paths: paths only "
                   "make sense with the -r option set"))
    parser.add_option("-t", "--threads", dest="count", default=7,
            type="int",
            help=("the number of threads to use(1..20) "
                  "[default %default]"))
    parser.add_option("-r", "--recurse", dest="recurse",
            default=False, action="store_true",
            help="recurse into subdirectories")
    parser.add_option("-d", "--debug", dest="debug", default=False,
                    action="store_true")
    opts, args = parser.parse_args()
    if len(args) == 0:
        parser.error("a word and at least one path must be specified")
    elif len(args) == 1:
        parser.error("at least one path must be specified")
    if (not opts.recurse and
        not any([os.path.isfile(arg) for arg in args])):
        parser.add("at least one file must be specified: or use -r")
    if not (1 <= opts.count <=20):
        parser.error("thread count must be 1..20")
    return opts, args[0], args[1:]

def get_files(args, recurse):
    filelist = []
    for path in args:
        if os.path.isfile(path):
            filelist.append(path)
        elif recurse:
            for root, dirs, files in os.walk(path):
                for filename in files:
                    filelist.append(os.path.join(root, filename))
    return filelist

main()

通过使用forking(在支持该机制的系统上,比如UNIX)或子进程(在那写不支持forking的系统上,比如Windows),multiprocessing模块可以提供线程类似的功能,因此,锁机制并不总是必须的,并且进程可以运行在操作系统支持的任何处理器核上。该包提供了几种在进程之间传递数据的方式,包括使用队列——可用于为进程提供工作载荷,就像queue.Queue可用于为线程提供工作载荷一样。

 

multiprocessing版本的主要好处是,在多核机器上,具有比线程化版本运行更快的潜力,因为这一版本可以在任何可用的处理器核上运行其进程。与标准的Python解释器(使用C编写,有时候称为CPython)相比,解释器有一个GIL(全局解释器锁),这意味着,在任何时刻上,只有一个线程可以执行Python代码。这一约束是一种实现上的细节,并不必然应用于其他Python解释器,比如Jython。

Python将工作分布到多个进程

Posted on 2012年3月01日 03:41

下面示例实现是在目录或者递归目录下查找文件中是否存在提供的字符串,返回该文件名。此示例是通过subprocess模块实现的多进程执行。

grepword-p.py

#!/usr/bin/env python3

import optparse
import os
import subprocess
import sys

def main():
	child = os.path.join(os.path.dirname(__file__),
						 "grepword-p-child.py")
	opts, word, args = parse_options()
	filelist = get_files(args, opts.recurse)
	files_per_process = len(filelist) // opts.count
	start, end = 0, files_per_process + (len(filelist) % opts.count)
	number = 1
	
	pipes = []
	while start < len(filelist):
		command = [sys.executable, child]
		if opts.debug:
			command.append(str(number))
		pipe = subprocess.Popen(command, stdin=subprocess.PIPE)
		pipes.append(pipe)
		pipe.stdin.write(word.encode("utf8") + b"\n")
		for filename in filelist[start:end]:
			pipe.stdin.write(filename.encode("utf8") + b"\n")
		pipe.stdin.close()
		number += 1
		start, end = end, end + files_per_process
	while pipes:
		pipe = pipes.pop()
		pipe.wait()
	
def parse_options():
	parser = optparse.OptionParser(
			usage=("usage: %prog [options] word name1 "
				   "[name2 [... nameN]]\n\n"
				   "names are filenames or paths; paths only "
				   "make sense with the -r option set"))
	parser.add_option("-p", "--processes", dest="count", default=7,
					  type="int",
					  help=("the number of child processes to use (1..20) "
							"[default %default]"))
	parser.add_option("-r", "--recurse", dest="recurse",
					  default=False, action="store_true",
					  help="recurse into subdirectories")
	parser.add_option("-d", "--debug", dest="debug", default=False,
					  action="store_true")
	opts, args = parser.parse_args()
	if len(args) == 0:
		parser.error("a word and at least one path must be specified")
	elif len(args) == 1:
		parser.error("at least one path must be specified")
	if (not opts.recurse and 
		not any([os.path.isfile(arg) for arg in args])):
		parser.error("at least one file must be specified; or use -r")
	if not (1 <= opts.count <= 20):
		parser.error("process count must be 1..20")
	return opts, args[0], args[1:]
	
def get_files(args, recurse):
	filelist = []
	for path in args:
		if os.path.isfile(path):
			filelist.append(path)
		elif recurse:
			for root, dirs, files in os.walk(path):
				for filename in files:
					filelist.append(os.path.join(root, filename))
	return filelist
	
main()

 

grepword-p-child.py

#!/usr/bin/env python3
import sys

BLOCK_SIZE = 8000

number = "{0}: ".format(sys.argv[1]) if len(sys.argv) == 2 else ""
stdin = sys.stdin.buffer.read()
lines = stdin.decode("utf8", "ignore").splitlines()
word = lines[0].rstrip()

for filename in lines[1:]:
	filename = filename.rstrip()
	previous = ""
	try:
		with open(filename, "rb") as fh:
			while True:
				current = fh.read(BLOCK_SIZE)
				if not current:
					break
				current = current.decode("utf8", "ignore")
				if (word in current or 
					word in previous[-len(word):] +
							current[:len(word)]):
					print("{0}{1}".format(number, filename))
					break
				if len(current) != BLOCK_SIZE:
					break
				previous = current
	except EnviromentError as err:
		print("{0}{1}".format(number, err))
		
								

接下来将研究将工作分配给多线程执行!

JavaScript 获取数组中最大值、最小值

Posted on 2012年2月29日 20:32

笨方法:

Array.prototype.max = function() {  
 var max = this[0];
 var len = this.length; 
 for (var i = 1; i < len; i++){   
  if (this[i] > max) {      
   max = this[i];   
  } 
 }   
 return max;
}
Array.prototype.min = function() {
 var min = this[0];
 var len = this.length;
 for (var i = 1; i < len; i++){ 
  if (this[i] < min){     
   min = this[i];   
  }  
 }   
 return min;
}

 如果你是引入类库进行工作,怕类库中有同名方法,那么我可以在创建之前做判断

if (typeof Array.prototype['max'] == 'undefined') { 
 Array.prototype.max = function() {    
  //************略*************
 }
}

John Resig 《Secrets of the JavaScript Ninja》

巧妙地利用apply方法来调用原生的Math.max与Math.min方法迅速求得结果。apply能让一个方法指定调用对象与传入参数,并且传入参数是以数组形式组织的。恰恰现在有一个方法叫Math.max,调用对象为Math,与多个参数。

Array.max = function( array ){   
 return Math.max.apply( Math, array );
};
 
Array.min = function( array ){    
 return Math.min.apply( Math, array );
};

不过,John Resig是把它们做成Math对象的静态方法,不能使用大神最爱用的链式调用了。但这方法还能更精简一些,不要忘记,Math对象也是一个对象,我们用对象的字面量来写,又可以省几个比特了。

 

Array.prototype.max = function(){  
   return Math.max.apply({},this);
}
Array.prototype.min = function(){  
   return Math.min.apply({},this);
}

 

Python交互式解释器自动补全

Posted on 2012年2月28日 19:02
import readline  
import rlcompleter  
readline.parse_and_bind("tab: complete")  

 

可以将其保存为

 

~/.pythonstartup.py

 

然后

 

再~/.bashrc增加一个环境变量

 

export PYTHONSTARTUP=~/.pythonstartup.py

 

这样每次启动就会自动运行了

Python的常用命令行选项

Posted on 2012年2月28日 19:01

 

选项

说明(以及对应的环境变量)

-c

Python语句指定为命令行的一部分

-E

忽略所有环境变量

-h

打印选项和帮助摘要的完整列表,然后结束运行

-i

不管制定什么样的(PYTHONINSPECT),都确保一个交互式会话

-m

指定一个Python模块作为主脚本运行

-O

优化生成的字节代码(PYTHONOPTIMIZE)

-OO

-O相似,并将从字节代码中删除存档字符串

-Q arg

控制整数的除法运算符/的行为

-S

忽略启动时的隐含的importsite

-t

在制表符(tab)和空格(blankspace)的使用不一致时,产生警告消息

-tt

-t相似,但是将产生错误消息,而不是警告消息

-u

对标准输出和标准错误使用无缓冲的二进制文件(PYTHONUNBUFFERED

-v

详细跟踪模块的导入和清除操作(PYTHONVERBOSE

-V

打印Python的版本号,然后终止运行

-W arg

向警告筛选器添加一个条目

-x

排除(跳过)主脚本源代码的第一行