了解python 中日志异步发送到远程服务器


本文摘自php中文网,作者coldplay.xixi,侵删。

python视频教程栏目了解python中日志异步发送到远程服务器的方法。

在python中使用日志最常用的方式就是在控制台和文件中输出日志了,logging模块也很好的提供的相应的类,使用起来也非常方便,但是有时我们可能会有一些需求,如还需要将日志发送到远端,或者直接写入数据库,这种需求该如何实现呢?

一、StreamHandler和FileHandler

首先我们先来写一套简单输出到cmd和文件中的代码

# -*- coding: utf-8 -*-"""

-------------------------------------------------

   File Name:     loger

   Description :

   Author :       yangyanxing

   date:          2020/9/23

-------------------------------------------------

"""import loggingimport sysimport os# 初始化loggerlogger = logging.getLogger("yyx")

logger.setLevel(logging.DEBUG)# 设置日志格式fmt = logging.Formatter('[%(asctime)s] [%(levelname)s] %(message)s','%Y-%m-%d %H:%M:%S')# 添加cmd handlercmd_handler = logging.StreamHandler(sys.stdout)

cmd_handler.setLevel(logging.DEBUG)

cmd_handler.setFormatter(fmt)# 添加文件的handlerlogpath = os.path.join(os.getcwd(),'debug.log')

file_handler = logging.FileHandler(logpath)

file_handler.setLevel(logging.DEBUG)

file_handler.setFormatter(fmt)# 将cmd和file handler添加到logger中logger.addHandler(cmd_handler)

logger.addHandler(file_handler)

 

logger.debug("今天天气不错")复制代码

首先初始化一个logger, 并且设置它的日志级别是DEBUG,然后添初始化了 cmd_handler和 file_handler, 最后将它们添加到logger中, 运行脚本,会在cmd中打印出[2020-09-23 10:45:56] [DEBUG] 今天天气不错且会写入到当前目录下的debug.log文件中.

二、添加HTTPHandler

如果想要在记录时将日志发送到远程服务器上,可以添加一个HTTPHandler, 在python标准库logging.handler中,已经为我们定义好了很多handler,有些我们可以直接用,本地使用tornado写一个接收日志的接口,将接收到的参数全都打印出来

# 添加一个httphandlerimport logging.handlers

http_handler = logging.handlers.HTTPHandler(r"127.0.0.1:1987",'/api/log/get')

http_handler.setLevel(logging.DEBUG)

http_handler.setFormatter(fmt)

logger.addHandler(http_handler)

 

logger.debug("今天天气不错")复制代码

结果在服务端我们收到了很多信息

{

    'name': [b'yyx'],

    'msg': [b'\xe4\xbb\x8a\xe5\xa4\xa9\xe5\xa4\xa9\xe6\xb0\x94\xe4\xb8\x8d\xe9\x94\x99'],

    'args': [b'()'],

    'levelname': [b'DEBUG'],

    'levelno': [b'10'],

    'pathname': [b'I:/workplace/yangyanxing/test/loger.py'],

    'filename': [b'loger.py'],

    'module': [b'loger'],

    'exc_info': [b'None'],

    'exc_text': [b'None'],

    'stack_info': [b'None'],

    'lineno': [b'41'],

    'funcName': [b'<module>'],

    'created': [b'1600831054.8881223'],

    'msecs': [b'888.1223201751709'],

    'relativeCreated': [b'22.99976348876953'],

    'thread': [b'14876'],

    'threadName': [b'MainThread'],

    'processName': [b'MainProcess'],

    'process': [b'8648'],

    'message': [b'\xe4\xbb\x8a\xe5\xa4\xa9\xe5\xa4\xa9\xe6\xb0\x94\xe4\xb8\x8d\xe9\x94\x99'],

    'asctime': [b'2020-09-23 11:17:34']

}复制代码

可以说是信息非常之多,但是却并不是我们想要的样子,我们只是想要类似于[2020-09-23 10:45:56] [DEBUG] 今天天气不错这样的日志.

logging.handlers.HTTPHandler只是简单的将日志所有信息发送给服务端,至于服务端要怎么组织内容是由服务端来完成. 所以我们可以有两种方法,一种是改服务端代码,根据传过来的日志信息重新组织一下日志内容, 第二种是我们重新写一个类,让它在发送的时候将重新格式化日志内容发送到服务端.

我们采用第二种方法,因为这种方法比较灵活, 服务端只是用于记录,发送什么内容应该是由客户端来决定。

我们需要重新定义一个类,我们可以参考logging.handlers.HTTPHandler这个类,重新写一个httpHandler类

每个日志类都需要重写emit方法,记录日志时真正要执行是也就是这个emit方法

classCustomHandler(logging.Handler):

    def __init__(self, host, uri, method="POST"):

        logging.Handler.__init__(self)

        self.url ="%s/%s"% (host, uri)

        method = method.upper()       ifmethod not in ["GET","POST"]:            raise ValueError("method must be GET or POST")

        self.method = method    def emit(self, record):

        '''

        :param record:

        :return:

        '''

        msg = self.format(record)       ifself.method =="GET":           if(self.url.find("?") >= 0):

                sep ='&'

            else:

                sep ='?'

            url = self.url +"%c%s"% (sep, urllib.parse.urlencode({"log": msg}))

            requests.get(url, timeout=1)       else:

            headers = {               "Content-type":"application/x-www-form-urlencoded",               "Content-length": str(len(msg))

            }

            requests.post(self.url, data={'log': msg}, headers=headers, timeout=1)复制代码

上面代码中有一行定义发送的参数msg = self.format(record)

这行代码表示,将会根据日志对象设置的格式返回对应的内容. 之后再将内容通过requests库进行发送,无论使用get 还是post方式,服务端都可以正常的接收到日志

[2020-09-23 11:43:50] [DEBUG] 今天天气不错

三、异步的发送远程日志

现在我们考虑一个问题,当日志发送到远程服务器过程中,如果远程服务器处理的很慢,会耗费一定的时间,那么这时记录日志就会都变慢

修改服务器日志处理类,让其停顿5秒钟,模拟长时间的处理流程

async def post(self):

    print(self.getParam('log'))    await asyncio.sleep(5)

    self.write({"msg":'ok'})复制代码

此时我们再打印上面的日志

logger.debug("今天天气不错")

logger.debug("是风和日丽的")复制代码

得到的输出为

[2020-09-23 11:47:33] [DEBUG] 今天天气不错

[2020-09-23 11:47:38] [DEBUG] 是风和日丽的复制代码

我们注意到,它们的时间间隔也是5秒。

那么现在问题来了,原本只是一个记录日志,现在却成了拖累整个脚本的累赘,所以我们需要异步的来处理远程写日志。

3.1 使用多线程处理

首先想的是应该是用多线程来执行发送日志方法

def emit(self, record):

    msg = self.format(record)   ifself.method =="GET":       if(self.url.find("?") >= 0):

            sep ='&'

        else:

            sep ='?'

        url = self.url +"%c%s"% (sep, urllib.parse.urlencode({"log": msg}))

        t = threading.Thread(target=requests.get, args=(url,))

        t.start()   else:

        headers = {           "Content-type":"application/x-www-form-urlencoded",           "Content-length": str(len(msg))

        }

        t = threading.Thread(target=requests.post, args=(self.url,), kwargs={"data":{'log': msg},"headers":headers})

        t.start()复制代码

这种方法是可以达到不阻塞主目的,但是每打印一条日志就需要开启一个线程,也是挺浪费资源的。我们也可以使用线程池来处理

3.2 使用线程池处理

python 的 concurrent.futures 中有ThreadPoolExecutor, ProcessPoolExecutor类,是线程池和进程池,就是在初始化的时候先定义几个线程,之后让这些线程来处理相应的函数,这样不用每次都需要新创建线程

线程池的基本使用

exector = ThreadPoolExecutor(max_workers=1) # 初始化一个线程池,只有一个线程exector.submit(fn, args, kwargs) # 将函数submit到线程池中复制代码

如果线程池中有n个线程,当提交的task数量大于n时,则多余的task将放到队列中.

再次修改上面的emit函数

exector = ThreadPoolExecutor(max_workers=1)def emit(self, record):

    msg = self.format(record)

    timeout = aiohttp.ClientTimeout(total=6)   ifself.method =="GET":       if(self.url.find("?") >= 0):

            sep ='&'

        else:

            sep ='?'

        url = self.url +"%c%s"% (sep, urllib.parse.urlencode({"log": msg}))

        exector.submit(requests.get, url, timeout=6)   else:

        headers = {           "Content-type":"application/x-www-form-urlencoded",           "Content-length": str(len(msg))

        }

        exector.submit(requests.post, self.url, data={'log': msg}, headers=headers, timeout=6)复制代码

这里为什么要只初始化一个只有一个线程的线程池? 因为这样的话可以保证先进队列里的日志会先被发送,如果池子中有多个线程,则不一定保证顺序了。

3.3 使用异步aiohttp库来发送请求

上面的CustomHandler类中的emit方法使用的是requests.post来发送日志,这个requests本身是阻塞运行的,也正上由于它的存在,才使得脚本卡了很长时间,所们我们可以将阻塞运行的requests库替换为异步的aiohttp来执行get和post方法, 重写一个CustomHandler中的emit方法

classCustomHandler(logging.Handler):

    def __init__(self, host, uri, method="POST"):

        logging.Handler.__in

相关阅读 >>

Python怎么导出eps文件

Python实现的求解最小公倍数算法示例

如何用Python画简单的动物

Python中的析构函数详解

Python tqmd模块实现进度条显示法

Python fd是什么意思

Python命令行参数是什么

如何利用Python实现图片转字符画详解

Python字典的操作总结(附示例)

Python 怎么调用百度地图api

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...