如题,本文的目的是为了提供一种使用OSS监控服务的数据灵活控制OSS服务形态的例子,以方便大家能够举一反三,实现更多的通用方法解决多样的需求。
其实OSS监控服务已经提供了报警功能,能够方便用户对OSS已经提供的metric指标进行监控报警,及时发现问题并进行处理。但是这种报警也只是做到了通知用户,通过邮件、旺旺、短信的方式,然而接下来如何行动,还是要靠用户自己了。另外,监控项的监控,仅仅是当前的监控情况,还没有对一段时间内的数据累计(或者求峰谷值、平均值等等)情况进行监控的功能。
虽然如此,别忘了OSS监控服务提供了数据访问的Open API,还有多种语言的SDK,方便你处理你的数据。如果能够用好这些监控数据,联结各种产品的提供的接口,可以解决很多特制的需求。
这里我举个使用的场景吧。之前在论坛上看到过用户吐槽OSS没有流量监控功能,后来监控服务上线之后,又有位童鞋给我留言说还是不能满足他的需求,因为他希望OSS在流量使用的“累计总值”超过他设置的阈值之后,能够自动限制对他的Bucket资源的请求情况。
下面呢,我就结合OSS监控服务的SDK和OSS的SDK,给大家演示一下,满足一下这位童鞋的需求哈。
需求分析:
在bucket的权限为public read的情况下,用户的bucket可以接受任何合法的读请求访问,获取数据,从而产品流出流量。而公网流出流量我们是会收取流量资费的。
如果用户希望控制每日的费用支出,那么可以在每天流量消耗到一定的程度,就收回bucket的public read权限,改为private。那么在流量超限之后,所有的请求将会受到“AccessDeny”错误码。
这样,你的目的就到达了,是吧。
代码示例:
这里简单写个代码示例演示一下,如何满足以上需求功能:
代码功能:
从进程启动开始监控流量使用总量,每10分钟获取一次流量监控数据(每分钟一个值),如果总量超过设置的阈值,那么设置bucket的acl为private,退出进程。
#!/bin/env python
#-*- coding:utf-8 -*-
from aliyunsdkcore import client
from aliyunsdkcms.request.v20151020 import QueryMetricRequest
import oss2
import time
import json
# 请填好您的配置
access_id = 'your access id'
access_key = 'your access key'
bucket_name = 'your bucket'
endpoint = 'your endpoint'
# util func
def date_2_sec(s, format = '%Y-%m-%d %H:%M:%S'):
tp = time.strptime(s, format)
return int(time.mktime(tp))
def sec_2_date(sec, format = '%Y-%m-%d %H:%M:%S'):
tp = time.localtime(sec)
return time.strftime(format, tp)
def get_throughput_metric_from_cms(start_time, end_time):
'''
从OSS监控服务中获取公网流出流量在一点时间范围内的指标
:param start_time: 监控数据的起始时间,格式"2016-07-23 22:59:00"
:param end_time: 监控数据的结束时间,格式"2016-07-23 23:09:00"
:return
'''
project = 'acs_oss'
metric = 'InternetSend'
dimensions = '{"BucketName":"%s"}' % bucket_name
clt = client.AcsClient(access_id, access_key,'cn-hangzhou')
request = QueryMetricRequest.QueryMetricRequest()
request.set_accept_format('json')
request.set_Project(project)
request.set_Metric(metric)
request.set_StartTime(start_time)
request.set_EndTime(end_time)
request.set_Dimensions(dimensions)
request.set_Period('60')
result = clt.do_action(request)
result = json.loads(result)
data_list = []
for data in result['Datapoints']['Datapoint']:
data_list.append(data[metric])
print '[%s - %s]: %s' % (start_time, end_time, data_list)
return data_list
def set_bucket_acl():
auth = oss2.Auth(access_id, access_key)
bucket = oss2.Bucket(auth, endpoint, bucket_name)
bucket.put_bucket_acl(oss2.BUCKET_ACL_PRIVATE)
print 'set bucket %s to %s' % (bucket_name, oss2.BUCKET_ACL_PRIVATE)
def limit_throughput_task(period, threshold):
total_throughput = 0
start_time = sec_2_date(int(time.time()))
while True:
time.sleep(period)
end_time = sec_2_date(int(time.time()))
data_list = get_throughput_metric_from_cms(start_time, end_time)
total_throughput += sum(data_list)
print 'now total_throughput is %d' % total_throughput
if total_throughput >= threshold:
set_bucket_acl()
break
start_time = end_time
if __name__ == '__main__':
# 每10分钟获取一次metric, 阈值设置为4000Byte
limit_throughput_task(600, 4000)
print 'task finished'
监控指标除了公网流出流量之外,当然还有容量、可用性、请求个数等等;操作方式除了控制OSS bucket权限之外,还可以触发删除指定object、订阅MNS、导出监控数据到实时分析/离线分析系统等等。
各种组合形式,各种需求功能,就看你自己怎么用啦。
云监控SDK安装和使用参见[云监控SDK]。
OSS SDK安装和使用参见[OSS SDK]。
插播广告哈:
存储服务是阿里云最核心的服务,我们不但支持文件/对象/表格/日志等多种形式的存储,也正在研发下一代事件驱动的serverless计算服务。在这里,你的代码可能运行在几十万台服务器上,不但处理整个阿里巴巴集团最核心的数据,也会成为整个阿里云平台上万千企业云上数据的坚实基础,甚至开启下一代计算的新篇章。
所以,我们诚聘您的加入,简历投至shuting.yst@alibaba-inc.com,在校优秀人才、社会牛人看过来哦~~