生物学家必备大数据实用计算技巧

生物学家必备大数据实用计算技巧
分享
扫描下方二维码分享到微信
打开微信,点击右上角”+“,
使用”扫一扫“即可将网页分享到朋友圈。
作者: [美] ,
出版社: 科学出版社
2020-04
版次: 31
ISBN: 9787030644909
定价: 198.00
装帧: 其他
开本: 128开
纸张: 胶版纸
分类: 自然科学
10人买过
  • 面对生物数据的急速增长,对大数据的分析处理能力是生物学家普遍缺乏又急需掌握的能力。《生物学家必备大数据实用计算技巧》是在作者开发计算工具和帮助许多生物学家解决计算问题时总结经验的基础上诞生的,是针对生物学家撰写的简明实用教程,它将一系列强大而灵活的实用工具汇集到一起,容易学习入门。《生物学家必备大数据实用计算技巧》内容以分子生物信息学数据为主,但也适用于多种其他生物数据的分析工作。《生物学家必备大数据实用计算技巧》原版问世至今,一直是欧美高校生物专业和相关研究机构必备的热销图书。 目录

    在开始之前 1

    引言 1

    为什么要写这本书? 1

    为什么只针对生物学家? 2

    需要使用特定计算机或程序吗? 2

    写给使用这本书自学的读者 3

    写给使用这本书的教师 3

    超越这本书 4

    如何使用好这本书 4

    **部分 文本文件

    第1章 开始设置 9

    关于文本文件的操作介绍 9

    什么是文本文件 9

    在一个文本文件内组织数据 10

    文本编辑器 11

    安装TextWrangler 11

    在文本编辑器里优化文本外观 12

    行尾结束符 13

    示例文件 13

    安装示例文件 14

    探索示例文件 14

    总结 15

    第2章 正则表达式:强大的搜索和替换 16

    一种用于搜索和替换的广泛语言 16

    了解这个新工具箱的组件 17

    设置文本编辑器 17

    你的**个通配符:\w 代替字母和数字 19

    用()来捕获文本 20

    量词:用 来对应一个或多个实体 21

    用\进行标点符号字符转义 23

    更为特殊的搜索项:\s \t \r.\d 24

    示例:分子数据文件的重新格式化 25

    关于生成正则表达式的评论 26

    总结 27

    第3章 探索正则表达式的灵活性 28

    字符集:定义你自己的通配符 28

    用[]定义定制的字符集 28

    应用自定义字符集 28

    否定字符集:用[^]定义自定义字符集 30

    边界:^开头和$结尾 31

    使量词更加精密 32

    另一个量词:*为零次或多次 32

    用?修改贪婪程度 33

    用{}符号控制匹配的数量 33

    把所有都放在一起 34

    生成替换关键词 35

    构建可靠的搜索 36

    总结 37

    进一步学习 38

    第二部分 Shell命令

    第4章 命令行操作:shell 41

    初次接触:不要惧怕命令行 41

    开始了解shell然后产生兴趣 42

    开始了解shell 42

    文件系统的命令行视图 43

    路径 44

    利用shell在计算机里遨游 45

    用ls列出文件,用pwd找出你在哪里 45

    如何用cd来回移动位置 47

    用~表示主目录 48

    用mkdir和rmdir来添加和移除文件夹 49

    复制文件 49

    移动文件 51

    命令行快捷键 51

    向上箭头键 51

    Tab 52

    用命令行参数来修正命令的行为 53

    用less命令浏览文件内容 54

    在命令行中使用man命令查看帮助文件 55

    命令行*终会使你的操作更容易 55

    路径描述中的通配符 55

    复制和移动多个文件 56

    结束你的终端会话 57

    总结 57

    推荐阅读 58

    第5章 在shell中处理文本 59

    用nano在命令行里编辑文本文件 59

    控制shell里的数据流 61

    用>重定向输出到一个文件 61

    用cat来显示和连接文件 62

    用grep在命令行中使用正则表达式 64

    处理一个大数据集 64

    从文件中抽提特定的行 64

    用管道|将输出从一个程序重定向到另一个程序 66

    用grep跨越搜索多个文件 67

    改善grep的行为 68

    用curl获取Web上的内容 69

    其他shell命令 71

    总结 72

    第6章 使用shell编写脚本 73

    组合命令 73

    搜索路径 73

    命令行如何找到它应执行的命令 73

    创建你的工作区—脚本文件夹 75

    编辑你的.bash_profile文件来进行个性化设置 76

    检查你的新$PATH 77

    把文本文档型文件转变为软件 78

    #!控制脚本文本用何种程序解释 79

    通过调整权限使文本文件可以被执行 79

    生成自动脚本 81

    批量复制文件 81

    灵活的文件重命名 84

    运用curl自动检索参考文献 86

    用curl编写脚本的几个常用方法 88

    用Alias创建快捷别名 88

    总结 89

    进一步学习 89

    第三部分 编程

    第7章 编程组件 93

    程序是什么? 93

    接下来几章的目标 93

    实际编程 94

    变量 95

    变量的剖析 95

    基本变量类型 96

    能够容纳其他变量的变量 97

    数组和列表 97

    不同类型之间的转换 99

    运行中的变量 99

    数学运算符 99

    比较运算符与逻辑运算符 100

    函数 101

    流控制 102

    用if语句做决策 102

    由for与while构成的循环 103

    使用列表和字典 104

    列表 104

    字典 105

    其他数据类型 105

    输入和输出 106

    用户交互 106

    文件 106

    库和模块 107

    注释语句 108

    对象 108

    总结 109

    第8章 开始使用Python编程 110

    为什么选择Python 110

    编写程序 111

    开始运行程序 111

    构建dnacalc.py程序 112

    简单的print语句 112

    len()函数 114

    使用str()、int()和float()转换变量类型 115

    内置字符串函数.count() 116

    整数和浮点数的数学运算 116

    使用#添加评论 118

    使用%运算符控制字符串格式 118

    获取用户输入 120

    使用raw_input()收集用户输入 120

    用.replace()和.upper()整理变量 121

    回顾你的程序 123

    总结 123

    第9章 决策与循环 124

    Python交互式提示符 124

    获取Python的帮助 126

    向dnacalc.py里添加更多的计算内容 127

    if 条件语句 127

    使用缩进指定代码块 128

    逻辑运算符 128

    if 语句 129

    else:语句 130

    for循环介绍 132

    列表简介 132

    在proteincalc.py中写入for循环 133

    创建字典 133

    其他字典函数 139

    应用你学会的循环技能 140

    回顾列表 140

    列表的索引 141

    从列表中解包多个值 143

    用range()函数定义一个列表 143

    列表和字符串的比较 145

    列表和字符串之间转换 146

    向列表中添加元素 147

    从列表中删除元素 148

    查找列表的内容 148

    给列表排序 148

    识别列表及字符串中独有的元素 149

    列表推导式 150

    总结 152

    进一步学习 153

    第10章 读取与写入文件 154

    目标概述 154

    从文件中逐条读取每一行内容 156

    读取数据文件之前的注意事项 156

    打开并读取文本文件 157

    用.strip()删除行尾字符 159

    跳过标题行 159

    从行中解析数据 160

    将行拆分为数据字段 160

    从列表中选择元素 161

    写入文件 162

    扼要重述文件的基本读写过程 164

    使用正则表达式解析值 165

    导入re模块 165

    通过re模块使用正则表达式 165

    re.search()与re.sub()的使用总结 167

    使用def创建自定义Python函数 168

    用新格式打包数据 173

    检查标记语言 173

    在转换期间保留信息 174

    转换为KML格式 174

    KML文件格式 174

    生成KML 文本 175

    总结 179

    进一步学习 179

    第11章 合并文件 180

    从多个文件中读取数据 180

    使用sys.argv获取用户的输入内容 181

    将所有参数转换为文件列表 183

    使用sys.stderr.write()提供反馈 184

    循环遍历文件列表 185

    打印输出并生成标题行 187

    避免硬编码软件 187

    文件读取的其他应用 190

    总结 192

    进一步学习 192

    第12章 模块与库 194

    导入模块 194

    更多来自标准库的内置模块 196

    urllib模块 196

    os模块 197

    math模块 197

    random模块 198

    time模块 199

    第三方模块 200

    NumPy 201

    Biopython 202

    其他第三方模块 203

    制作自己的模块 204

    继续深入学习Python 205

    总结 206

    进一步学习 206

    第13章 调试策略 207

    在调试中学习 207

    通用策略 208

    建立工作元素 208

    思考你的假设 208

    具体的调试技术 209

    隔离问题 209

    编写冗长的软件 210

    错误信息及其含义 211

    常见的Python错误 211

    shell错误 212

    让你的程序更有效率 212

    优化 212

    使用try和except来处理错误 213

    当你实在被困住时 214

    总结 215

    进一步学习 215

    第四部分 多种方法合并

    第14章 选择和组合工具 219

    你的工具箱 219

    数据处理任务的类别 219

    获取数字数据 219

    重新格式化文本文件 222

    综合考虑 226

    总结 226

    进一步学习 226

    第15章 关系型数据库 227

    电子表格和数据组织 227

    数据管理系统 229

    剖析一个数据库 230

    安装MySQL 231

    开始使用MySQL和SQL 233

    连接到命令行中的MySQL服务器 233

    创建数据库和表 235

    向表中添加数据行和显示表的内容 239

    在Python中与MySQL进行交互 240

    解析输入的文本 241

    从数据中构造SQL 243

    从Python中执行SQL命令 244

    将文本文件导入到表格中 249

    创建ctd表 250

    用LOAD DATA命令导入数据文件 251

    以SQL文件的形式导出和导入数据库 253

    用SQL探索数据 253

    用SELECT和COUNT命令汇总表 253

    用GROUP BY校对数据 255

    SQL中的数学运算 256

    用WHERE对行进行精确选择 256

    用UPDATE修改行 259

    跨表选择数据 260

    使用Python 生成输出 262

    继续向前看 264

    数据库用户和安全性 264

    创建一个root密码 265

    添加一个新的MySQL用户 265

    总结 266

    进一步学习 267

    推荐阅读 267

    第16章 高级的shell和管道命令 268

    其他有用的shell命令 268

    用head和tail提取行 268

    用cut提取列 268

    用sort对行排序 270

    用uniq分离出独有的行 271
  • 内容简介:
    面对生物数据的急速增长,对大数据的分析处理能力是生物学家普遍缺乏又急需掌握的能力。《生物学家必备大数据实用计算技巧》是在作者开发计算工具和帮助许多生物学家解决计算问题时总结经验的基础上诞生的,是针对生物学家撰写的简明实用教程,它将一系列强大而灵活的实用工具汇集到一起,容易学习入门。《生物学家必备大数据实用计算技巧》内容以分子生物信息学数据为主,但也适用于多种其他生物数据的分析工作。《生物学家必备大数据实用计算技巧》原版问世至今,一直是欧美高校生物专业和相关研究机构必备的热销图书。
  • 目录:
    目录

    在开始之前 1

    引言 1

    为什么要写这本书? 1

    为什么只针对生物学家? 2

    需要使用特定计算机或程序吗? 2

    写给使用这本书自学的读者 3

    写给使用这本书的教师 3

    超越这本书 4

    如何使用好这本书 4

    **部分 文本文件

    第1章 开始设置 9

    关于文本文件的操作介绍 9

    什么是文本文件 9

    在一个文本文件内组织数据 10

    文本编辑器 11

    安装TextWrangler 11

    在文本编辑器里优化文本外观 12

    行尾结束符 13

    示例文件 13

    安装示例文件 14

    探索示例文件 14

    总结 15

    第2章 正则表达式:强大的搜索和替换 16

    一种用于搜索和替换的广泛语言 16

    了解这个新工具箱的组件 17

    设置文本编辑器 17

    你的**个通配符:\w 代替字母和数字 19

    用()来捕获文本 20

    量词:用 来对应一个或多个实体 21

    用\进行标点符号字符转义 23

    更为特殊的搜索项:\s \t \r.\d 24

    示例:分子数据文件的重新格式化 25

    关于生成正则表达式的评论 26

    总结 27

    第3章 探索正则表达式的灵活性 28

    字符集:定义你自己的通配符 28

    用[]定义定制的字符集 28

    应用自定义字符集 28

    否定字符集:用[^]定义自定义字符集 30

    边界:^开头和$结尾 31

    使量词更加精密 32

    另一个量词:*为零次或多次 32

    用?修改贪婪程度 33

    用{}符号控制匹配的数量 33

    把所有都放在一起 34

    生成替换关键词 35

    构建可靠的搜索 36

    总结 37

    进一步学习 38

    第二部分 Shell命令

    第4章 命令行操作:shell 41

    初次接触:不要惧怕命令行 41

    开始了解shell然后产生兴趣 42

    开始了解shell 42

    文件系统的命令行视图 43

    路径 44

    利用shell在计算机里遨游 45

    用ls列出文件,用pwd找出你在哪里 45

    如何用cd来回移动位置 47

    用~表示主目录 48

    用mkdir和rmdir来添加和移除文件夹 49

    复制文件 49

    移动文件 51

    命令行快捷键 51

    向上箭头键 51

    Tab 52

    用命令行参数来修正命令的行为 53

    用less命令浏览文件内容 54

    在命令行中使用man命令查看帮助文件 55

    命令行*终会使你的操作更容易 55

    路径描述中的通配符 55

    复制和移动多个文件 56

    结束你的终端会话 57

    总结 57

    推荐阅读 58

    第5章 在shell中处理文本 59

    用nano在命令行里编辑文本文件 59

    控制shell里的数据流 61

    用>重定向输出到一个文件 61

    用cat来显示和连接文件 62

    用grep在命令行中使用正则表达式 64

    处理一个大数据集 64

    从文件中抽提特定的行 64

    用管道|将输出从一个程序重定向到另一个程序 66

    用grep跨越搜索多个文件 67

    改善grep的行为 68

    用curl获取Web上的内容 69

    其他shell命令 71

    总结 72

    第6章 使用shell编写脚本 73

    组合命令 73

    搜索路径 73

    命令行如何找到它应执行的命令 73

    创建你的工作区—脚本文件夹 75

    编辑你的.bash_profile文件来进行个性化设置 76

    检查你的新$PATH 77

    把文本文档型文件转变为软件 78

    #!控制脚本文本用何种程序解释 79

    通过调整权限使文本文件可以被执行 79

    生成自动脚本 81

    批量复制文件 81

    灵活的文件重命名 84

    运用curl自动检索参考文献 86

    用curl编写脚本的几个常用方法 88

    用Alias创建快捷别名 88

    总结 89

    进一步学习 89

    第三部分 编程

    第7章 编程组件 93

    程序是什么? 93

    接下来几章的目标 93

    实际编程 94

    变量 95

    变量的剖析 95

    基本变量类型 96

    能够容纳其他变量的变量 97

    数组和列表 97

    不同类型之间的转换 99

    运行中的变量 99

    数学运算符 99

    比较运算符与逻辑运算符 100

    函数 101

    流控制 102

    用if语句做决策 102

    由for与while构成的循环 103

    使用列表和字典 104

    列表 104

    字典 105

    其他数据类型 105

    输入和输出 106

    用户交互 106

    文件 106

    库和模块 107

    注释语句 108

    对象 108

    总结 109

    第8章 开始使用Python编程 110

    为什么选择Python 110

    编写程序 111

    开始运行程序 111

    构建dnacalc.py程序 112

    简单的print语句 112

    len()函数 114

    使用str()、int()和float()转换变量类型 115

    内置字符串函数.count() 116

    整数和浮点数的数学运算 116

    使用#添加评论 118

    使用%运算符控制字符串格式 118

    获取用户输入 120

    使用raw_input()收集用户输入 120

    用.replace()和.upper()整理变量 121

    回顾你的程序 123

    总结 123

    第9章 决策与循环 124

    Python交互式提示符 124

    获取Python的帮助 126

    向dnacalc.py里添加更多的计算内容 127

    if 条件语句 127

    使用缩进指定代码块 128

    逻辑运算符 128

    if 语句 129

    else:语句 130

    for循环介绍 132

    列表简介 132

    在proteincalc.py中写入for循环 133

    创建字典 133

    其他字典函数 139

    应用你学会的循环技能 140

    回顾列表 140

    列表的索引 141

    从列表中解包多个值 143

    用range()函数定义一个列表 143

    列表和字符串的比较 145

    列表和字符串之间转换 146

    向列表中添加元素 147

    从列表中删除元素 148

    查找列表的内容 148

    给列表排序 148

    识别列表及字符串中独有的元素 149

    列表推导式 150

    总结 152

    进一步学习 153

    第10章 读取与写入文件 154

    目标概述 154

    从文件中逐条读取每一行内容 156

    读取数据文件之前的注意事项 156

    打开并读取文本文件 157

    用.strip()删除行尾字符 159

    跳过标题行 159

    从行中解析数据 160

    将行拆分为数据字段 160

    从列表中选择元素 161

    写入文件 162

    扼要重述文件的基本读写过程 164

    使用正则表达式解析值 165

    导入re模块 165

    通过re模块使用正则表达式 165

    re.search()与re.sub()的使用总结 167

    使用def创建自定义Python函数 168

    用新格式打包数据 173

    检查标记语言 173

    在转换期间保留信息 174

    转换为KML格式 174

    KML文件格式 174

    生成KML 文本 175

    总结 179

    进一步学习 179

    第11章 合并文件 180

    从多个文件中读取数据 180

    使用sys.argv获取用户的输入内容 181

    将所有参数转换为文件列表 183

    使用sys.stderr.write()提供反馈 184

    循环遍历文件列表 185

    打印输出并生成标题行 187

    避免硬编码软件 187

    文件读取的其他应用 190

    总结 192

    进一步学习 192

    第12章 模块与库 194

    导入模块 194

    更多来自标准库的内置模块 196

    urllib模块 196

    os模块 197

    math模块 197

    random模块 198

    time模块 199

    第三方模块 200

    NumPy 201

    Biopython 202

    其他第三方模块 203

    制作自己的模块 204

    继续深入学习Python 205

    总结 206

    进一步学习 206

    第13章 调试策略 207

    在调试中学习 207

    通用策略 208

    建立工作元素 208

    思考你的假设 208

    具体的调试技术 209

    隔离问题 209

    编写冗长的软件 210

    错误信息及其含义 211

    常见的Python错误 211

    shell错误 212

    让你的程序更有效率 212

    优化 212

    使用try和except来处理错误 213

    当你实在被困住时 214

    总结 215

    进一步学习 215

    第四部分 多种方法合并

    第14章 选择和组合工具 219

    你的工具箱 219

    数据处理任务的类别 219

    获取数字数据 219

    重新格式化文本文件 222

    综合考虑 226

    总结 226

    进一步学习 226

    第15章 关系型数据库 227

    电子表格和数据组织 227

    数据管理系统 229

    剖析一个数据库 230

    安装MySQL 231

    开始使用MySQL和SQL 233

    连接到命令行中的MySQL服务器 233

    创建数据库和表 235

    向表中添加数据行和显示表的内容 239

    在Python中与MySQL进行交互 240

    解析输入的文本 241

    从数据中构造SQL 243

    从Python中执行SQL命令 244

    将文本文件导入到表格中 249

    创建ctd表 250

    用LOAD DATA命令导入数据文件 251

    以SQL文件的形式导出和导入数据库 253

    用SQL探索数据 253

    用SELECT和COUNT命令汇总表 253

    用GROUP BY校对数据 255

    SQL中的数学运算 256

    用WHERE对行进行精确选择 256

    用UPDATE修改行 259

    跨表选择数据 260

    使用Python 生成输出 262

    继续向前看 264

    数据库用户和安全性 264

    创建一个root密码 265

    添加一个新的MySQL用户 265

    总结 266

    进一步学习 267

    推荐阅读 267

    第16章 高级的shell和管道命令 268

    其他有用的shell命令 268

    用head和tail提取行 268

    用cut提取列 268

    用sort对行排序 270

    用uniq分离出独有的行 271
查看详情
相关图书 / 更多
生物学家必备大数据实用计算技巧
生物分离与纯化技术(第三版)
辛秀兰
生物学家必备大数据实用计算技巧
生物分离工程原理与应用
汪文俊,金文闻,向福
生物学家必备大数据实用计算技巧
生物学传奇
席德强
生物学家必备大数据实用计算技巧
生物医学工程导论
张建保,赵俊
您可能感兴趣 / 更多
生物学家必备大数据实用计算技巧
归属感:如何通过社群获得商业竞争优势
[美]大卫·斯平克斯(David Spinks) 著;颉腾文化 出品
生物学家必备大数据实用计算技巧
《世界上最大的肚子》2024百班千人暑期书目学前中班名师推荐全新正版现货速发
[美]雷米·查利普(美)柏顿·萨普瑞
生物学家必备大数据实用计算技巧
《不完美的你》2024百班千人暑期书目小学生6年级名师推荐全新正版现货速发
[美]M.埃文·沃肯斯坦 著;蔡春露 李钦 译
生物学家必备大数据实用计算技巧
经济学通义
[美]阿门·A.阿尔钦 (美)威廉·R.艾伦 著;[美]杰里·L.乔丹 编
生物学家必备大数据实用计算技巧
数字化领导力 数字化转型锦囊,领导力精进指南 一本书掌握数字化转型领导力之道
[美]艾萨克·萨科里克 著;王磊 译;颉腾文化 出品;邓斌
生物学家必备大数据实用计算技巧
法哲学基本原理
[美]马克·C.墨菲
生物学家必备大数据实用计算技巧
雪花的故事(用照片展示雪花的秘密,为你揭开冬日奇景的奥秘)
[美]马克·卡西诺[美]乔恩·尼尔森
生物学家必备大数据实用计算技巧
杜甫传
[美]弗洛伦斯.艾思柯
生物学家必备大数据实用计算技巧
美利坚在燃烧:20世纪60年代以来的警察暴力与黑人反抗
[美]伊丽莎白·欣顿 著 胡位钧 译
生物学家必备大数据实用计算技巧
温柔亲启
[美]艾米莉·狄金森 著;[美]艾伦·路易斯·哈特、[美]玛莎·内尔·史密斯 编
生物学家必备大数据实用计算技巧
儒教中国及其现代命运(三部曲)
[美]列文森 作者;[中]季剑青 译者
生物学家必备大数据实用计算技巧
逃家小兔成长绘本系列
[美]玛格丽特.怀兹.布朗