]> piware.de Git - bin.git/blob - workitems.py
add workitems.py
[bin.git] / workitems.py
1 #!/usr/bin/python
2
3 import urllib, re, sys, optparse, os.path, datetime
4 import sqlite3 as dbapi2
5
6 blueprints_base_url = 'https://blueprints.launchpad.net'
7
8 valid_states = set(['todo', 'done', 'postponed'])
9
10 def get_db(dbpath):
11     '''Open/initialize database.
12
13     This creates the database if it does not exist.
14     '''
15     init = not os.path.exists(dbpath)
16
17     db = dbapi2.connect(dbpath)
18
19     if init:
20         cur = db.cursor()
21         cur.execute('''CREATE TABLE work_items (
22             blueprint VARCHAR(255) NOT NULL,
23             workitem VARCHAR(255) NOT NULL,
24             status VARCHAR(20) NOT NULL,
25             date TIMESTAMP NOT NULL)''')
26         db.commit()
27
28     return db
29
30 def parse_argv():
31     '''Parse CLI arguments.
32
33     Return (options, args) tuple.
34     '''
35     optparser = optparse.OptionParser()
36     optparser.add_option('-d', '--database',
37         help='Path to database', dest='database', metavar='PATH')
38     optparser.add_option('-r', '--release',
39         help='Release name', dest='release')
40     optparser.add_option('-p', '--pattern', metavar='REGEX',
41         help='Regex pattern for blueprint name', dest='pattern')
42     optparser.add_option('-D', '--dump', action='store_true', default=False,
43         help='Dump database', dest='dump')
44     optparser.add_option('-t', '--text', action='store_true', default=False,
45         help='Print work item summary in text format', dest='text')
46     optparser.add_option('-c', '--csv', action='store_true', default=False,
47         help='Print work item summary in text format', dest='csv')
48     optparser.add_option('--from', metavar='YYYY-MM-DD',
49         help='Generate CSV data from this day on', dest='from_date')
50     optparser.add_option('--to', metavar='YYYY-MM-DD',
51         help='Generate CSV data until this day', dest='to_date')
52
53     (opts, args) = optparser.parse_args()
54
55     if not opts.database:
56         optparser.error('No database given')
57     if not opts.dump and not opts.text and not opts.csv:
58         if not opts.release:
59             optparser.error('No release given')
60         if not opts.pattern:
61             optparser.error('No pattern given')
62
63     return (opts, args)
64
65 def get_blueprints(url, nname_pattern):
66     '''Return a list of blueprint URLs for the current release.'''
67
68     blueprint_name_filter = re.compile('href="(/ubuntu/\+spec/%s[^"]+)"' %
69             name_pattern)
70
71     result = []
72     for l in urllib.urlopen(url):
73         m = blueprint_name_filter.search(l)
74         if m:
75             result.append(blueprints_base_url + m.group(1))
76
77     return result
78
79 def get_workitems(blueprint_url):
80     '''Collect work items from a particular blueprint URL.
81
82     This will return a list of ('item', 'status') pairs.
83     '''
84     work_items_re = re.compile('(<p>|^)work items:\s*<br />', re.I)
85
86     found_workitems = False
87     result = []
88     for l in urllib.urlopen(blueprint_url):
89         if not found_workitems:
90             if work_items_re.search(l):
91                 found_workitems = True
92             continue
93
94         l = l.strip()
95         if l.endswith('<br />'):
96             l = l[:-6]
97
98         # ends with empty line
99         if l.endswith('</p>') or not l:
100             break
101
102         try:
103             (desc, state) = l.rsplit(':', 1)
104         except ValueError:
105             print >> sys.stderr, 'ERROR: invalid work item format: ' + l
106             continue
107         desc = desc.strip()
108         state = state.strip().lower()
109         if not state:
110             state = 'todo'
111         if state not in valid_states:
112             print >> sys.stderr, 'ERROR: invalid state "%s" for work item "%s"' % (
113                 state, desc)
114             continue
115         result.append((desc, state))
116
117     return result
118
119 def dump(db):
120     '''Dump database contents.'''
121
122     cur = db.cursor()
123     cur.execute('SELECT * FROM work_items')
124     for (blueprint, workitem, status, date) in cur:
125         print '%s [%s]\t%s: %s' % (date, blueprint, workitem, status)
126
127 def add_work_item(db, blueprint, item, status):
128     '''Add work item to database.'''
129
130     cur = db.cursor()
131     cur.execute('INSERT INTO work_items VALUES (?, ?, ?, date(CURRENT_TIMESTAMP))',
132             (blueprint, item, status))
133
134 def import_lp(db, name_pattern, release):
135     '''Collect blueprint work items from Launchpad into DB.'''
136
137     blueprints = get_blueprints('%s//ubuntu/%s/+specs' % (blueprints_base_url,
138         opts.release), name_pattern)
139
140     for bp in blueprints:
141         #print 'Checking', bp
142         bpname = bp.split('/')[-1]
143         work_items = get_workitems(bp)
144         if not work_items:
145             print >> sys.stderr, 'WARNING: %s has no work items' % bpname
146         for (item, status) in work_items:
147             add_work_item(db, bpname, item, status)
148     db.commit()
149
150 def workitems_over_time(db):
151     '''Calculate work item development over time.
152
153     Return date -> state -> count mapping.
154     '''
155     data = {}
156     for s in valid_states:
157         cur = db.cursor()
158         cur.execute('SELECT date, count(*) FROM work_items WHERE status=? GROUP BY date',
159                 (s,))
160         for (date, num) in cur:
161             data.setdefault(date, {})[s] = num
162     return data
163
164 def blueprint_status(db):
165     '''Determine current blueprint status.
166
167     Return blueprint -> [todo, done, postponed] mapping.
168     '''
169     data = {}
170
171     # last date
172     cur = db.cursor()
173     cur.execute('SELECT max(date) FROM work_items')
174     (last_date,) = cur.fetchone()
175
176     index = 0
177     for s in valid_states:
178         cur = db.cursor()
179         cur.execute('SELECT blueprint, count(workitem) FROM work_items '
180                 'WHERE status = ? AND date = ? GROUP BY blueprint', 
181                 (s, last_date))
182         for (bp, num) in cur:
183             data.setdefault(bp, [0, 0, 0])[index] = num
184         index += 1
185
186     return data
187
188 def text(db):
189     '''Print work item status as text.'''
190
191     data = workitems_over_time(db)
192
193     print 'History:'
194     for d in sorted(data.keys()):
195         print d, data[d]
196
197     print '\nBlueprint status:'
198     data = blueprint_status(db)
199     for (bp, (todo, done, postponed)) in data.iteritems():
200         print '%s: %i/%i (%i%%)' % (bp, postponed+done, todo+done+postponed, 
201                 int(float(postponed+done)/(todo+done+postponed)*100 + 0.5))
202
203 def csv(db, from_date, to_date):
204     '''Print work item status as csv.'''
205
206     def _fmtdate(d):
207         '''Convert datetime.date into MM/DD/YYYY'''
208
209         return '%s/%s/%s' % (d.month, d.day, d.year)
210
211     def _fromstr(s):
212         '''Convert YYYY-MM-DD string to datetime.date'''
213
214         (y, m, d) = s.split('-')
215         return datetime.date(int(y), int(m), int(d))
216
217     data = workitems_over_time(db)
218
219     dates = sorted(data.keys())
220
221     f = _fromstr(from_date or dates[0])
222     t = _fromstr(to_date or dates[-1])
223
224     d = f
225     while d <= t:
226         entry = data.get('%i-%02i-%02i' % (d.year, d.month, d.day), {})
227         print '%02i/%02i/%i,%i,%i,%i' % (d.month, d.day, d.year, 
228                 entry.get('todo', 0), entry.get('done', 0),
229                 entry.get('postponed', 0))
230         d += datetime.timedelta(days=1)
231
232 #
233 # main
234 #
235
236 (opts, args) = parse_argv()
237
238 db = get_db(opts.database)
239
240 if opts.dump:
241     dump(db)
242 elif opts.text:
243     text(db)
244 elif opts.csv:
245     csv(db, opts.from_date, opts.to_date)
246 else:
247     import_lp(db, opts.pattern, opts.release)
248