文件’沪市股票top300.csv’中包含上海股票交易所上市的多支股票的名称和股票代码,其他文件为文件名对应股票代码的股票交易数据,使用这些文件进行运算并输出结果,如跌幅最大的10支股票代码的集合、成交量最大的10支股票代码集合、最高价最高的10支股票代码的集合、最低价最低的10支股票代码集合等。(为方便统计,本题中涨跌幅计算公式设定为:(最新记录收盘价-最早记录收盘价) / 最早记录收盘价 * 100。)
交易数据文件数据内容格式为:
Date,High,Low,Open,Close,Volume,Adj Close
2018-01-02,5.929999828338623,5.829999923706055,5.860000133514404,5.909999847412109,10649302.0,5.6797099113464355
2018-01-03,5.989999771118164,5.820000171661377,5.880000114440918,5.909999847412109,14893773.0,5.6797099113464355
2018-01-04,5.889999866485596,5.829999923706055,5.869999885559082,5.849999904632568,9974470.0,5.622048854827881
2018-01-05,5.880000114440918,5.820000171661377,5.849999904632568,5.849999904632568,6584055.0,5.622048854827881
2018-01-08,5.929999828338623,5.860000133514404,5.860000133514404,5.920000076293945,11096694.0,5.689321041107178
... ...
根据用户输入,利用集合运算和这些文件数据完成以下任务:
输入’涨幅与成交量’时:
参考示例格式输出:
涨幅和成交量均在前10名的股票:
涨幅或成交量在前10名的股票:
涨幅前10名,但成交量未进前10名的股票:
涨幅和成交量不同时在前10名的股票:
输入’涨幅与最高价’时:
参考示例格式输出:
涨幅和最高价均在前10名的股票:
涨幅或最高价在前10名的股票:
涨幅前10名,但最高价未进前10名的股票:
涨幅和最高价不同时在前10名的股票:
输入’跌幅与最低价’时:
参考示例格式输出:
跌幅和最低价均在前10名的股票:
跌幅或最低价在前10名的股票:
跌幅前10名,但最低价未进前10名的股票:
跌幅和最低价不同时在前10名的股票:
输入其他数据时:
输出:’输入错误’
# -------- ------- --------
# @File : 股票分析.py
# @Author : 赵广辉
# @Contact: vasp@qq.com
# @Company: 武汉理工大学
# @Version: 1.5
# @Modify : 2021/12/06 21:28
# Python程序设计基础,高等教育出版社
# -------- ------- --------
import os
import numpy as np
# 设置常量,对应各列数据的语义,方便索引
HIGH = 0
LOW = 1
OPEN = 2
CLOSE = 3
VOLUME = 4
ADJCLOSE = 5
def file_list(file):
"""
@参数 file: 文件名,字符串类型
将文件中的股票代码与股票名称读入到字典中,返回股票代码字典。
['600000', '600004', '600006', '600007', '600008', '600009',...]
"""
stock_name = {}
with open(file, 'r', encoding='utf-8') as stock_file:
for line in stock_file:
x = line.strip().split(',')
stock_name[x[0]] = x[1]
return stock_name # 股票代码与股票名字典
def filename_list(path):
"""接收路径字符串为参数,获取该路径下所有文件名,以列表形式返回
os.listdir(path)以列表形式返回path路径下的所有文件名,不包括子路径中的文件名"""
name_list = os.listdir(path)
return name_list
def statistics_of_all(code_list):
"""
@参数 code_list:股票代码列表,列表类型
接收股票数据文件名列表,逐个统计各股票数据文件涨跌幅、总成交量、最高价和最低价。
涨跌幅计算公式为:(最新记录收盘价-最早记录收盘价) / 最早记录收盘价 * 100
为方便处理,读入数据时,略过日期列。
"""
statistics_of_stock = []
for code in code_list:
data_of_code = np.genfromtxt('../data/' + code, dtype=None,
usecols=[1, 2, 3, 4, 5, 6], delimiter=',',
skip_header=1)
# 计算当前股票涨跌幅、总成交量、最高价和最低价
uplift_or_fall = round((data_of_code[:, CLOSE][-1] - data_of_code[:, CLOSE][0]) / data_of_code[:, CLOSE][0] * 100, 2)
volumes = round(sum(data_of_code[:, VOLUME]), 2)
high = round(max(data_of_code[:, HIGH]), 2)
low = round(min(data_of_code[:, LOW]), 2)
statistics_of_stock.append([code[:6], uplift_or_fall, volumes, high, low])
return statistics_of_stock # 每支股票涨跌幅、总成交量、最高价和最低价
def top_10_uplift(statistics_of_stock):
"""
@参数 statistics_of_stock:每支股票涨跌幅、总成交量、最高价和最低价统计信息,列表类型
按涨幅降序排序,涨幅相同时按股票代码降序排序,取排名前10的股票,
返回排名前10的股票代码,返回值为列表类型。
"""
sort_by_uplift = sorted(statistics_of_stock, key=lambda x: (x[1], x[0]), reverse=True)[:10]
top_uplift = [x[0] for x in sort_by_uplift]
return top_uplift
def top_10_fall(statistics_of_stock):
"""
@参数 statistics_of_stock:每支股票涨跌幅、总成交量、最高价和最低价统计信息,列表类型
按跌幅升序排序,跌幅相同时,按股票代码升序排序,取排名前10的股票,返回跌幅最大的10支股
票代码的集合。
"""
sort_by_fall = sorted(statistics_of_stock, key=lambda x: (x[1], x[0]))[:10]
top_fall = [x[0] for x in sort_by_fall]
return top_fall
def top_10_volumes(statistics_of_stock):
"""
@参数 statistics_of_stock:每支股票涨跌幅、总成交量、最高价和最低价统计信息,列表类型
按成交量降序排序,成交量相同时,按股票代码降序排序,取成交量前10的股票代码,返回成交量
最大的10支股票代码列表。
"""
sort_by_volumes = sorted(statistics_of_stock, key=lambda x: (x[2], x[0]))[-1:-11:-1]
top_volumes = [x[0] for x in sort_by_volumes]
return top_volumes
def top_10_high(statistics_of_stock):
"""
@参数 statistics_of_stock:每支股票涨跌幅、总成交量、最高价和最低价统计信息,列表类型
按最高价降序排序,最高价相同时,按股票代码降序排序返回,取排名前10的股票,返回最高价最
高的10支股票代码的列表。
"""
sort_by_high = sorted(statistics_of_stock, key=lambda x: (x[3], x[0]))[-1:-11:-1]
top_high = [x[0] for x in sort_by_high]
return top_high
def top_10_low(statistics_of_stock):
"""
@参数 statistics_of_stock:每支股票涨跌幅、总成交量、最高价和最低价统计信息,列表类型
按最低价升序排序,最低价相同时,按股票代码升序排序,取排名前10的股票,返回最低价最低的
10支股票代码集合。
"""
sort_by_low = sorted(statistics_of_stock, key=lambda x: (x[4], x[0]))[:10]
top_low = [x[0] for x in sort_by_low]
return top_low
def uplift_and_volumes(top_uplift, top_volumes):
"""
@参数 top_high,最高价在前10名的股票代码,字符串
@参数 top_volumes,成交量在前10名的股票代码,字符串
返回一个列表,其元素依序为以下4个:
涨幅和成交量均在前10名的股票,按股票代码升序,列表
涨幅或成交量在前10名的股票,按股票代码升序,列表
涨幅前10名,但成交量未进前10名的股票,按股票代码升序,列表
涨幅和成交量不同时在前10名的股票,按股票代码升序,列表
"""
both_of = sorted(set(top_uplift) & set(top_volumes))
any_of = sorted(set(top_uplift) | set(top_volumes))
uplift_no_volumes = sorted(set(top_uplift) - set(top_volumes))
uplift_or_volumes = sorted(set(top_uplift) ^ set(top_volumes))
# print(both_of,any_of,uplift_no_volumes,uplift_or_volumes)
return [both_of,any_of,uplift_no_volumes,uplift_or_volumes]
def high_and_uplift(top_uplift, top_high):
"""
@参数 top_high,最高价在前10名的股票代码,字符串
@参数 top_uplift,涨幅在前10名的股票代码,字符串
返回一个列表,其元素依序为以下4个:
涨幅和最高价均在前10名的股票代码,按股票代码升序,列表
涨幅或最高价在前10名的股票代码,按股票代码升序,列表
涨幅前10名,但最高价未进前10名的股票代码,按股票代码升序,列表
涨幅和最高价不同时在前10名的股票,按股票代码升序,列表
票代码。
"""
both_of = sorted(set(top_uplift) & set(top_high)) # 涨幅和最高价均在前10名的股票
any_of = sorted(set(top_uplift) | set(top_high)) # 涨幅或最高价在前10名的股票
uplift_no_high = sorted(set(top_uplift) - set(top_high)) # 涨幅前10名,但最高价未进前10名的股票
uplift_or_high = sorted(set(top_uplift) ^ set(top_high)) # 涨幅和最高价不同时在前10名的股票
return [both_of, any_of, uplift_no_high, uplift_or_high]
def low_and_fall(top_fall, top_low):
"""
@参数 top_low,最低价在前10名的股票代码,字符串
@参数 top_fall,跌幅在前10名的股票代码,字符串
返回一个列表,其元素依序为以下4个
跌幅和最低价均在前10名的股票代码,按股票代码升序,列表
跌幅或最低价在前10名的股票代码,按股票代码升序,列表
跌幅前10名,但最低价未进前10名的股票代码,按股票代码升序,列表
跌幅和最低价不同时在前10名的股票,按股票代码升序,列表
"""
both_of = sorted(set(top_fall) & set(top_low)) # 跌幅和最低价均在前10名的股票
any_of = sorted(set(top_fall) | set(top_low)) # 跌幅或最低价在前10名的股票
uplift_no_high = sorted(set(top_fall) - set(top_low)) # 跌幅前10名,但最低价未进前10名的股票
uplift_or_high = sorted(set(top_fall) ^ set(top_low)) # 跌幅和最低价不同时在前10名的股票
return [both_of, any_of, uplift_no_high, uplift_or_high]
def operation():
"""接收一个字符串为参数,根据参数值调用不同函数完成任务"""
statistics_of_list = statistics_of_all(stock_lst) # 对获取的股票数据进行统计
uplift_set = top_10_uplift(statistics_of_list) # 涨幅前10名集合
fall_set = top_10_fall(statistics_of_list) # 跌幅前10名集合
volumes_set = top_10_volumes(statistics_of_list) # 成交量前10名集合
high_set = top_10_high(statistics_of_list) # 最高价前10名集合
low_set = top_10_low(statistics_of_list) # 最低价前10名集合
opt = input()
if opt == '涨幅与成交量': # 输出抽中的单词
u_and_v = uplift_and_volumes(uplift_set, volumes_set)
print('涨幅和成交量均在前10名的股票:')
print(u_and_v[0]) # 涨幅和成交量均在前10名的股票
print('涨幅或成交量在前10名的股票:')
print(u_and_v[1]) # 涨幅或成交量在前10名的股票
print('涨幅前10名,但成交量未进前10名的股票:')
print(u_and_v[2]) # 涨幅前10名,但成交量未进前10名的股票
print('涨幅和成交量不同时在前10名的股票:')
print(u_and_v[3]) # 涨幅和成交量均在前10名的股票
elif opt == '涨幅与最高价':
u_and_h = high_and_uplift(uplift_set, high_set)
print('涨幅和最高价均在前10名的股票:')
print(u_and_h[0])
print('涨幅或最高价在前10名的股票:')
print(u_and_h[1])
print('涨幅前10名,但最高价未进前10名的股票:')
print(u_and_h[2])
print('涨幅和最高价不同时在前10名的股票:')
print(u_and_h[3])
elif opt == '跌幅与最低价':
f_and_l = low_and_fall(fall_set, low_set)
print('跌幅和最低价均在前10名的股票:')
print(f_and_l[0]) # 跌幅和最低价均在前10名的股票
print('跌幅或最低价在前10名的股票:')
print(f_and_l[1]) # 跌幅或最低价在前10名的股票
print('跌幅前10名,但最低价未进前10名的股票:')
print(f_and_l[2]) # 跌幅前10名,但最低价未进前10名的股票
print('跌幅和最低价不同时在前10名的股票:')
print(f_and_l[3]) # 跌幅前10名,但最低价未进前10名的股票,和最低价前10名但跌幅没进前10名的股票
else:
print('输入错误')
if __name__ == '__main__':
filename = './data/沪市股票top300.csv' # 股票名称与代码文件
stock_lst = ['600000.csv', '600004.csv', '600006.csv',
'600007.csv', '600008.csv', '600009.csv',
'600010.csv', '600011.csv', '600012.csv',
'600015.csv', '600016.csv', '600018.csv',
'600019.csv', '600020.csv', '600026.csv',
'600028.csv', '600029.csv', '600030.csv',
'600031.csv', '600033.csv', '600036.csv']
operation()