html_outputer.py

#!/usr/bin/env python2
# -*- coding: UTF-8 -*-
import csv
import datetime
import os
import codecs
import pymongo


class HtmlOutputer(object):


    def __init__(self):
        self.datas = {}
        self.clinet = pymongo.MongoClient()
        # self.addresses = ['223.3.77.26:20000', '223.3.83.196:20000', '223.3.90.150:20000']
        # self.clinet = pymongo.MongoClient(self.addresses)
        self.db = self.clinet['wechat_data']

    def collect_data(self, data):
        if data is None:
            return
        # data = (title, date, content, readNum, praise_num, discuss_content, discuss_praise)
        self.datas['title'] = data[0].encode('utf-8')
        self.datas['date'] = data[1].encode('utf-8')
        self.datas['content'] = data[2].encode('utf-8')
        self.datas['readNum'] = data[3].encode('utf-8')
        self.datas['praise_num'] = data[4].encode('utf-8')
        self.datas['discuss_content'] = [a.encode('utf-8') for a in data[5]]
        self.datas['discuss_praise'] = [a.encode('utf-8') for a in data[6]]
        return

    def clear_data(self):
        self.datas.clear()

    def output_html(self):
        fout = open('output.html', 'w')
        # fout.write("<html>")
        # fout.write("<body>")
        # fout.write("<table>")
        #
        # for data in self.datas:
        #     fout.write("<tr>")
        #     fout.write("<td>%s</td>" % data['url'])
        #     fout.write("<td>%s</td>" % data['title'].encode('utf-8'))
        #     fout.write("<td>%s</td>" % data['summary'].encode('utf-8'))
        #     fout.write("</tr>")
        # fout.write("</table>")
        # fout.write("</body>")
        # fout.write("</html>")
        fout.close()

    def output_file(self, full_path, data):
        oneday = datetime.timedelta(days=1)
        today = str(datetime.date.today())
        file_name = full_path+r'\%s.csv' % today
        col = ['title', 'name', 'date', 'content', 'readNum', 'praise_num', 'discuss_content', 'discuss_praise']

        if os.path.exists(file_name):
            f = open(file_name, 'a')
        else:
            f = open(file_name, 'w')
            f.write(codecs.BOM_UTF8)

        for i in range(6):
            f.write(col[i])
            f.write(':')
            f.write(data[i])
            f.write('\n')
        for i, e in enumerate(data[6], start=1):
            f.write('discuss_content %s:' % str(i))
            f.write(e)
            f.write('  ')
            f.write('discuss_praise %s:' % str(i))
            f.write(data[7][i-1])
            f.write('\n')
        f.write('\n')
        f.close()
        return

    def output_mongodb(self, name, data):
        col = ['title', 'name', 'date', 'content', 'readNum', 'praise_num', 'discuss_content', 'discuss_praise']
        collection = self.db[name]
        item = {}
        disscuss = []
        for i in range(6):
            item[col[i]] = data[i]
        for i, e in enumerate(data[6], start=1):
            ditem = {'discuss_content %s:' % str(i): e, 'discuss_praise %s:' % str(i): data[7][i-1]}
            disscuss.append(ditem)
        item['comment'] = disscuss
        collection.insert(item)

    def output_csv(self, full_path, data):
        today = str(datetime.date.today())
        file_name = full_path+r'\%s.csv' %today
        col = ['title', 'date', 'content', 'readNum', 'praise_num', 'discuss_content', 'discuss_praise']
        if os.path.exists(file_name):
            csvfile = file(file_name, 'ab')
            writer = csv.writer(csvfile, dialect='excel')
            # writer = csv.DictWriter(csvfile, col)
        else:
            with open(file_name,'w') as f:
                f.write(codecs.BOM_UTF8)
            csvfile = file(file_name, 'wb')
            writer = csv.writer(csvfile, dialect='excel')
            # writer = csv.DictWriter(csvfile, fieldnames=col)
            writer.writerow(col)
        print data
        writer.writerow(data)
        csvfile.close()