大数据是近几年广受关注的一个概念。今天,互联网不断发展,逐渐深入我们生活的各个层面,随之而来的是数据量的指数级增长。很久以前,人类就学会了通过分析数据获取有价值的结论。有时,影响结论的因素过多,采样的数据无法有效保留所有因素的影响,得出的结论就不够有效。如果不使用采样,而原始数据规模巨大,我们就需要改进数据处理的手段。
《Spark快速大数据分析》中英文PDF及代码
《Spark快速大数据分析》中文PDF,231页,带书签目录,文字可以复制。
《Spark快速大数据分析》英文PDF,274页,带书签目录,文字可以复制。
使用Spark进行大规模数据分析的实战宝典,由著名大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个最常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据。
作为计算框架,Spark速度快,开发简单,能同时兼顾批处理和实时数据分析,因此很快被广大企业级用户所采纳,并随着近年人工智能的崛起而成为分析和挖掘大数据的重要得力工具。
《Spark高级数据分析(第2版)》中文PDF+英文PDF+源代码
《Spark高级数据分析(第2版)》中文PDF,452页,带目录,文字可复制;英文PDF,455页,带目录,文字可复制;配套源代码。
下载: https://pan.baidu.com/s/19IiWLQ19KYMpW3rP8HDx9Q
提取码: 8krw
《Spark高级数据分析第2版》由业内知名数据科学家执笔,通过丰富的示例展示了如何结合Spark、统计方法和真实世界数据集来解决数据分析问题,既涉及模型的构建和评价,也涵盖数据清洗、数据预处理和数据探索,并描述了如何将结果变为生产应用,是运用Apache Spark进行大数据分析和处理的实战宝典。
《概率机器人》原版中文PDF+英文PDF+习题解答代码+课件
《概率机器人》原版中文PDF+英文PDF+习题解答代码+课件,513页,文字可以复制;
《概率机器人》原版中文PDF+英文PDF+习题解答代码+课件,668页,带目录,文字可以复制;
配套习题解答代码,配套课件。
下载: https://pan.baidu.com/s/1qjJG7E-3KYmn8cXteT6i6Q
提取码: bkyq
《概率机器人》对概率机器人学这一新兴领域进行了全面的介绍。概率机器人学依赖统计技术表示信息和进行决策,以容纳当今大多数机器人应用中必然存在的不确定性,是机器人学的一个分支。它依赖统计技术表示信息和制定决策。这样做,可以接纳在当今大多数机器人应用中引起的不确定性。本书主要专注于算法,对于每种算法,均提供了四项内容:①伪码示例;②完整的数学推导;③实验结果;④算法优缺点的详细讨论。《概率机器人》包括了基础知识、定位、地图构建、规划与控制四大部分。共17章,每章的后都提供了练习题和动手实践的项目。相信本书可以加深读者对概率机器人学的认识。写的几乎是纯理论,讲的很清晰。
《电路基础》讲述了电路分析的基本理论,共分为三篇:直流电路、交流电路以及高级电路分析。第一篇直流电路主要讲述电路分析的基本定律和定理、无源元件、有源元件以及一阶/二阶电路的分析方法;第二篇交流电路主要讲述相量、正弦稳态分析、交流功率分析、三相电路、磁耦合电路以及频率响应等;第三篇高级电路分析主要讲述拉普拉斯变换及其应用、傅里叶级数与傅里叶变换以及双口网络等。
《电路基础》第3版中文PDF+第5和6版英文PDF+第5版习题解答+亚历山大
《电路基础》第3版中文PDF,803页,带书签目录,文字可以复制。
《电路基础》第5版英文PDF,998页,带书签目录,彩色配图,文字可以复制。
《电路基础》第6版英文PDF,990页,带书签目录,彩色配图,文字可以复制。
《电路基础》第5版习题解答PDF,1972页,带书签目录,文字可以复制。
下载: https://pan.baidu.com/s/13Denl9axJakchbBOq86i2Q
提取码: 38gm
《电路基础》意趣盎然,内容全面,例题习题丰富,可供高校电子电气类各专业师生使用,也可供科研人员和技术人员参考。章节分类太棒了,和实际联系很紧密,电路理论入门的最佳读物!解释的深入浅出,娓娓道来。
深入分析你已经在使用的系统,并学习如何更高效地使用和运维这些系统;
通过识别不同工具的优缺点,作出更明智的决策;
了解一致性、可伸缩性、容错性和复杂度之间的权衡;
理解分布式系统研究,这些研究是现代数据库构建的基石;
走到一些主流在线服务的幕后,学习它们的架构。
《数据密集型应用系统设计》中文PDF+英文PDF+Martin Kleppmann
《数据密集型应用系统设计》中文PDF,470页,带书签目录,文字可以复制,译者:冯若航。
《数据密集型应用系统设计》英文PDF,613页,带书签目录,文字可以复制。
原作名: Designing Data-Intensive Applications 作者: Martin Kleppmann
下载: https://pan.baidu.com/s/1qPpdgvS86VWU62cUhGHG4Q
提取码: 596m
《相关性搜索利用Solr与Elasticsearch创建智能应用》中文PDF+英文PDF+源代码
《相关性搜索利用Solr与Elasticsearch创建智能应用》中文PDF,391页,带目录,文字可复制。
英文PDF,362页,带目录,文字可复制。
配套源代码。
下载: https://pan.baidu.com/s/1Qd58GB6z-yNoAAHMPaJVfQ
提取码: sd2b
构建智能搜索应用是现在互联网业务中的工程热点,相关性搜索需要一定的软性技能,较高的查全率保证了所有正确的匹配都会出现在搜索结果中,而较高的查准率则保证了搜索结果中只包含较少的错误匹配。
推荐学习《相关性搜索》,更多的是讲搜索的原理,如何实现与用户需求更相关的搜索结果,不囿于具体的语法,而是从高一层次讲述了相关性在搜索引擎中的重要性、实现和调优,加深了对搜索引擎的理解。
hadoop学习:《Hadoop权威指南第四版》中文PDF+英文PDF+代码
《Hadoop权威指南(第四版)》中文PDF,734页,带书签目录;英文PDF,805页,带书签目录。配套源代码。
下载: https://pan.baidu.com/s/1bINLu_pdl3cu8W7vv63bFg
提取码: y77c
结合理论和实践,《Hadoop权威指南第四版》由浅入深,全方位介绍了Hadoop 这一高性能的海量数据处理和分析平台。5部分24 章,第Ⅰ部分介绍Hadoop 基础知识,第Ⅱ部分介绍MapReduce,第Ⅲ部分介绍Hadoop 的运维,第Ⅳ部分介绍Hadoop 相关开源项目,第Ⅴ部分提供了三个案例。
Hadoop生态都有涉及,很厚很全:HDFS, MapReduce1&2(YARN), Hive, HBase, Pig, ZooKeeper, Sqoop等。 多数章节对自己的要求都是了解和能用即可,唯独ZK一章爱不释手,从算法到实现到操作到应用讲的真是好。 系统性学习不还是得看经典书籍。
《我和LABVIEW一个NI工程师的十年编程经验》第2版PDF代码
《我和LABVIEW一个NI工程师的十年编程经验》PDF,第2版,485页,带目录,文字可复制。
配套源代码。作者:阮奇桢
下载: https://pan.baidu.com/s/1TVO0iweitS6FVXzBMYPEqg
提取码: t1f4
LabVIEW是一种程序开发环境,类似于C和BASIC开发环境,但是LabVIEW与其他计算机语言的显著区别是:其他计算机语言都是采用基于文本的语言产生代码,而LabVIEW使用的是图形化编辑语言G编写程序,产生的程序是框图的形式。 LabVIEW软件是NI设计平台的核心,也是开发测量或控制系统的理想选择。 LabVIEW开发环境集成了工程师和科学家快速构建各种应用所需的所有工具,旨在帮助工程师和科学家解决问题、提高生产力和不断创新。