综合项目 - 8.4.3 股票分析 - 《Python程序设计数字教程》

文件’沪市股票top300.csv’中包含上海股票交易所上市的多支股票的名称和股票代码，其他文件为文件名对应股票代码的股票交易数据，使用这些文件进行运算并输出结果，如跌幅最大的10支股票代码的集合、成交量最大的10支股票代码集合、最高价最高的10支股票代码的集合、最低价最低的10支股票代码集合等。（为方便统计，本题中涨跌幅计算公式设定为：(最新记录收盘价-最早记录收盘价) / 最早记录收盘价 * 100。）‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
交易数据文件数据内容格式为：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬

Date,High,Low,Open,Close,Volume,Adj Close
2018-01-02,5.929999828338623,5.829999923706055,5.860000133514404,5.909999847412109,10649302.0,5.6797099113464355
2018-01-03,5.989999771118164,5.820000171661377,5.880000114440918,5.909999847412109,14893773.0,5.6797099113464355
2018-01-04,5.889999866485596,5.829999923706055,5.869999885559082,5.849999904632568,9974470.0,5.622048854827881
2018-01-05,5.880000114440918,5.820000171661377,5.849999904632568,5.849999904632568,6584055.0,5.622048854827881
2018-01-08,5.929999828338623,5.860000133514404,5.860000133514404,5.920000076293945,11096694.0,5.689321041107178
... ...

根据用户输入，利用集合运算和这些文件数据完成以下任务：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
输入’涨幅与成交量’时：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
参考示例格式输出：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
涨幅和成交量均在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
涨幅或成交量在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
涨幅前10名，但成交量未进前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
涨幅和成交量不同时在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
输入’涨幅与最高价’时：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
参考示例格式输出：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
涨幅和最高价均在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
涨幅或最高价在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
涨幅前10名，但最高价未进前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
涨幅和最高价不同时在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
输入’跌幅与最低价’时：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
参考示例格式输出：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
跌幅和最低价均在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
跌幅或最低价在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
跌幅前10名，但最低价未进前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
跌幅和最低价不同时在前10名的股票:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
输入其他数据时：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬
输出：’输入错误’

# --------      -------    --------
# @File   : 股票分析.py 
# @Author : 赵广辉   
# @Contact: vasp@qq.com
# @Company: 武汉理工大学
# @Version: 1.5
# @Modify : 2021/12/06 21:28
# Python程序设计基础，高等教育出版社
# --------      -------    --------
import os
import numpy as np
# 设置常量，对应各列数据的语义，方便索引
HIGH = 0
LOW = 1
OPEN = 2
CLOSE = 3
VOLUME = 4
ADJCLOSE = 5
def file_list(file):
    """
    @参数 file: 文件名，字符串类型
    将文件中的股票代码与股票名称读入到字典中，返回股票代码字典。
    ['600000', '600004', '600006', '600007', '600008', '600009',...]
    """
    stock_name = {}
    with open(file, 'r', encoding='utf-8') as stock_file:
        for line in stock_file:
            x = line.strip().split(',')
            stock_name[x[0]] = x[1]
    return stock_name   # 股票代码与股票名字典
def filename_list(path):
    """接收路径字符串为参数，获取该路径下所有文件名，以列表形式返回
    os.listdir(path)以列表形式返回path路径下的所有文件名，不包括子路径中的文件名"""
    name_list = os.listdir(path)
    return name_list
def statistics_of_all(code_list):
    """
    @参数 code_list：股票代码列表，列表类型
    接收股票数据文件名列表，逐个统计各股票数据文件涨跌幅、总成交量、最高价和最低价。
    涨跌幅计算公式为：(最新记录收盘价-最早记录收盘价) / 最早记录收盘价 * 100
    为方便处理，读入数据时，略过日期列。
    """
    statistics_of_stock = []
    for code in code_list:
        data_of_code = np.genfromtxt('../data/' + code, dtype=None,
                                     usecols=[1, 2, 3, 4, 5, 6], delimiter=',',
                                     skip_header=1)
        # 计算当前股票涨跌幅、总成交量、最高价和最低价
        uplift_or_fall = round((data_of_code[:, CLOSE][-1] - data_of_code[:, CLOSE][0]) / data_of_code[:, CLOSE][0] * 100, 2)
        volumes = round(sum(data_of_code[:, VOLUME]), 2)
        high = round(max(data_of_code[:, HIGH]), 2)
        low = round(min(data_of_code[:, LOW]), 2)
        statistics_of_stock.append([code[:6], uplift_or_fall, volumes, high, low])
    return statistics_of_stock  # 每支股票涨跌幅、总成交量、最高价和最低价
def top_10_uplift(statistics_of_stock):
    """
    @参数 statistics_of_stock：每支股票涨跌幅、总成交量、最高价和最低价统计信息，列表类型
    按涨幅降序排序，涨幅相同时按股票代码降序排序，取排名前10的股票，
    返回排名前10的股票代码，返回值为列表类型。
    """
    sort_by_uplift = sorted(statistics_of_stock, key=lambda x: (x[1], x[0]), reverse=True)[:10]
    top_uplift = [x[0] for x in sort_by_uplift]
    return top_uplift
def top_10_fall(statistics_of_stock):
    """
    @参数 statistics_of_stock：每支股票涨跌幅、总成交量、最高价和最低价统计信息，列表类型
    按跌幅升序排序，跌幅相同时，按股票代码升序排序，取排名前10的股票，返回跌幅最大的10支股
    票代码的集合。
    """
    sort_by_fall = sorted(statistics_of_stock, key=lambda x: (x[1], x[0]))[:10]
    top_fall = [x[0] for x in sort_by_fall]
    return top_fall
def top_10_volumes(statistics_of_stock):
    """
    @参数 statistics_of_stock：每支股票涨跌幅、总成交量、最高价和最低价统计信息，列表类型
    按成交量降序排序，成交量相同时，按股票代码降序排序，取成交量前10的股票代码，返回成交量
    最大的10支股票代码列表。
    """
    sort_by_volumes = sorted(statistics_of_stock, key=lambda x: (x[2], x[0]))[-1:-11:-1]
    top_volumes = [x[0] for x in sort_by_volumes]
    return top_volumes
def top_10_high(statistics_of_stock):
    """
    @参数 statistics_of_stock：每支股票涨跌幅、总成交量、最高价和最低价统计信息，列表类型
    按最高价降序排序，最高价相同时，按股票代码降序排序返回，取排名前10的股票，返回最高价最
    高的10支股票代码的列表。
    """
    sort_by_high = sorted(statistics_of_stock, key=lambda x: (x[3], x[0]))[-1:-11:-1]
    top_high = [x[0] for x in sort_by_high]
    return top_high
def top_10_low(statistics_of_stock):
    """
    @参数 statistics_of_stock：每支股票涨跌幅、总成交量、最高价和最低价统计信息，列表类型
    按最低价升序排序，最低价相同时，按股票代码升序排序，取排名前10的股票，返回最低价最低的
    10支股票代码集合。
    """
    sort_by_low = sorted(statistics_of_stock, key=lambda x: (x[4], x[0]))[:10]
    top_low = [x[0] for x in sort_by_low]
    return top_low
def uplift_and_volumes(top_uplift, top_volumes):
    """
    @参数 top_high，最高价在前10名的股票代码，字符串
    @参数 top_volumes，成交量在前10名的股票代码，字符串
    返回一个列表，其元素依序为以下4个：
    涨幅和成交量均在前10名的股票，按股票代码升序，列表
    涨幅或成交量在前10名的股票,按股票代码升序，列表
    涨幅前10名，但成交量未进前10名的股票,按股票代码升序，列表
    涨幅和成交量不同时在前10名的股票,按股票代码升序，列表
    """
    both_of = sorted(set(top_uplift) & set(top_volumes))
    any_of = sorted(set(top_uplift) | set(top_volumes))
    uplift_no_volumes = sorted(set(top_uplift) - set(top_volumes))
    uplift_or_volumes = sorted(set(top_uplift) ^ set(top_volumes))
    # print(both_of,any_of,uplift_no_volumes,uplift_or_volumes)
    return [both_of,any_of,uplift_no_volumes,uplift_or_volumes]
def high_and_uplift(top_uplift, top_high):
    """
    @参数 top_high，最高价在前10名的股票代码，字符串
    @参数 top_uplift，涨幅在前10名的股票代码，字符串
    返回一个列表，其元素依序为以下4个：
    涨幅和最高价均在前10名的股票代码,按股票代码升序，列表
    涨幅或最高价在前10名的股票代码,按股票代码升序，列表
    涨幅前10名，但最高价未进前10名的股票代码,按股票代码升序，列表
    涨幅和最高价不同时在前10名的股票,按股票代码升序，列表
    票代码。
    """
    both_of = sorted(set(top_uplift) & set(top_high))  # 涨幅和最高价均在前10名的股票
    any_of = sorted(set(top_uplift) | set(top_high))  # 涨幅或最高价在前10名的股票
    uplift_no_high = sorted(set(top_uplift) - set(top_high))  # 涨幅前10名，但最高价未进前10名的股票
    uplift_or_high = sorted(set(top_uplift) ^ set(top_high))  # 涨幅和最高价不同时在前10名的股票
    return [both_of, any_of, uplift_no_high, uplift_or_high]
def low_and_fall(top_fall, top_low):
    """
    @参数 top_low，最低价在前10名的股票代码，字符串
    @参数 top_fall，跌幅在前10名的股票代码，字符串
    返回一个列表，其元素依序为以下4个
    跌幅和最低价均在前10名的股票代码,按股票代码升序，列表
    跌幅或最低价在前10名的股票代码,按股票代码升序，列表
    跌幅前10名，但最低价未进前10名的股票代码,按股票代码升序，列表
    跌幅和最低价不同时在前10名的股票,按股票代码升序，列表
    """
    both_of = sorted(set(top_fall) & set(top_low))  # 跌幅和最低价均在前10名的股票
    any_of = sorted(set(top_fall) | set(top_low))  # 跌幅或最低价在前10名的股票
    uplift_no_high = sorted(set(top_fall) - set(top_low))  # 跌幅前10名，但最低价未进前10名的股票
    uplift_or_high = sorted(set(top_fall) ^ set(top_low))  # 跌幅和最低价不同时在前10名的股票
    return [both_of, any_of, uplift_no_high, uplift_or_high]
def operation():
    """接收一个字符串为参数，根据参数值调用不同函数完成任务"""
    statistics_of_list = statistics_of_all(stock_lst)  # 对获取的股票数据进行统计
    uplift_set = top_10_uplift(statistics_of_list)     # 涨幅前10名集合
    fall_set = top_10_fall(statistics_of_list)         # 跌幅前10名集合
    volumes_set = top_10_volumes(statistics_of_list)   # 成交量前10名集合
    high_set = top_10_high(statistics_of_list)         # 最高价前10名集合
    low_set = top_10_low(statistics_of_list)           # 最低价前10名集合
    opt = input()
    if opt == '涨幅与成交量':       # 输出抽中的单词
        u_and_v = uplift_and_volumes(uplift_set, volumes_set)
        print('涨幅和成交量均在前10名的股票:')
        print(u_and_v[0])  # 涨幅和成交量均在前10名的股票
        print('涨幅或成交量在前10名的股票:')
        print(u_and_v[1])  # 涨幅或成交量在前10名的股票
        print('涨幅前10名，但成交量未进前10名的股票:')
        print(u_and_v[2])  # 涨幅前10名，但成交量未进前10名的股票
        print('涨幅和成交量不同时在前10名的股票:')
        print(u_and_v[3])  # 涨幅和成交量均在前10名的股票
    elif opt == '涨幅与最高价':
        u_and_h = high_and_uplift(uplift_set, high_set)
        print('涨幅和最高价均在前10名的股票:')
        print(u_and_h[0])
        print('涨幅或最高价在前10名的股票:')
        print(u_and_h[1])
        print('涨幅前10名，但最高价未进前10名的股票:')
        print(u_and_h[2])
        print('涨幅和最高价不同时在前10名的股票:')
        print(u_and_h[3])
    elif opt == '跌幅与最低价':
        f_and_l = low_and_fall(fall_set, low_set)
        print('跌幅和最低价均在前10名的股票:')
        print(f_and_l[0])  # 跌幅和最低价均在前10名的股票
        print('跌幅或最低价在前10名的股票:')
        print(f_and_l[1])  # 跌幅或最低价在前10名的股票
        print('跌幅前10名，但最低价未进前10名的股票:')
        print(f_and_l[2])  # 跌幅前10名，但最低价未进前10名的股票
        print('跌幅和最低价不同时在前10名的股票:')
        print(f_and_l[3])  # 跌幅前10名，但最低价未进前10名的股票，和最低价前10名但跌幅没进前10名的股票
    else:
        print('输入错误')
if __name__ == '__main__':
    filename = './data/沪市股票top300.csv'              # 股票名称与代码文件
    stock_lst = ['600000.csv', '600004.csv', '600006.csv',
                 '600007.csv', '600008.csv', '600009.csv',
                 '600010.csv', '600011.csv', '600012.csv',
                 '600015.csv', '600016.csv', '600018.csv',
                 '600019.csv', '600020.csv', '600026.csv',
                 '600028.csv', '600029.csv', '600030.csv',
                 '600031.csv', '600033.csv', '600036.csv']
    operation()