分布式版本控制系统入门
 

2009-12-11 作者:Noah Gift,Adam Shand 来源:IBM

 
本文内容包括:
您是否对分布式版本控制感兴趣,但是又被一大堆行话弄糊涂了?本文介绍三种主要的系统(Git、Mercurial 和 Bazaar),讨论采用分布式工作流的一些优点,比较分布式版本控制的常用操作。

简介

在过去几年,对于分布式版本控制可以给开发过程提供的益处有许多争论。最近,分布式工具已经很成熟了。尽管分布式工具的一些优点最初可能不明显,但是从长期来看,它们提供的灵活性是非常有意义的。阅读完本文之后,您应该能够开始使用分布式版本控制系统,基本了解分布式模型能够提供的优点。

围绕分布式版本控制的争论主要集中在不再需要的中心服务器。这是一个非常独特的特性,对于一些开发人员组很重要,但是它的真正价值在于,它允许开发人员组实现他们选择的几乎任何工作流。它能够完成很多事情,比如传统的集中式模型,或两个开发人员在咖啡馆通过无线连接协同工作,等等。

允许开发人员以各种新的方式工作,这是分布式版本控制真正令人兴奋的特点。实际上,在本文末尾会介绍如何实现这样的“咖啡馆”工作流。这对于作家、学校教师和 Linux® 内核开发人员都有益处。

什么是分布式版本控制?

分布式版本控制 (DVCS) 是一种不需要中心服务器的管理文件版本的方法,但是它也可以使用中心服务器。更改可以被合并到 DVCS 的任何其他用户的系统中,因此可以实现非常灵活的工作流。

DVCS 的两个主要优点是:它比集中的版本控制更灵活,因为它除了支持传统的(集中式)工作流,还支持其他各种工作流;它比集中式服务器快得多,因为大多数操作在客户机本地进行,而不需要网络操作。

DVCS 和集中式版本控制系统的主要差异

在 DVCS 和集中式版本控制系统之间有三个关键差异。第一个差异是,DVCS 通过本地提交支持离线工作,这是由 DVCS 的操作方式决定的。这与集中式版本控制完全不同,集中式版本控制要求通过到中心服务器的连接执行所有操作。这种灵活性让开发人员在飞机上也能够像在办公室中一样轻松地工作,可以一次又一次地进行提交。

第二个差异是 DVCS 比集中式系统更灵活,因为 DVCS 支持许多不同类型的工作流,从传统的集中式工作流到纯粹的特殊工作流,再到特殊工作流和集中式工作流的组合。这种灵活性允许通过电子邮件、对等网络和开发团队喜欢的任何方式进行开发。

第三个差异是 DVCS 比集中式版本控制系统快得多,因为大多数操作在客户机上进行,速度非常快。另外,在需要进行推(push )操作(与另一个节点通信)时,速度也更快,因为两个客户机机器上都有完整的元数据。速度差异相当显著,根据使用本地存储库还是网络存储库,DVCS 比 Subversion 快大约 3-10 倍。

分布式版本控制工作流

因为 DVCS 非常灵活,可以实现各种各样的工作流,但是由于篇幅有限,本文只讨论两种工作流。首先讨论最常用的工作流之一 Partner 工作流。按照 Partner 工作流,一个开发人员启动一个项目,然后进行分支。然后,在不同开发人员工作的分支之间来回合并更改。

第二种常用的工作流是通过本地提交使用集中式服务器。在这种工作流中,开发人员的工作方式与使用集中式 subversion 存储库时非常相似,但是他们进行本地提交,然后把最终更改推到集中式服务器。这种工作流有许多变体,包括与 Partner 工作流结合使用。重要的是,可以采用许多种工作方式,通过使用 DVCS,可以灵活地选择最适合自己的工作方式。

快速入门指南

了解一种新技术的最好方法之一是实际使用它。在本节中,简要介绍 Mercurial、Bazaar 和 Git 中的常用操作,您可以试试这些操作:

  • Mercurial
    • 安装: sudo easy_install-2.5 mercurial
    • 建立项目目录: mkdir hgrepo; cd hgrepo
    • 初始化项目: hg init
    • 添加文件: touch foo.txt; hg add foo.txt
    • 提交: hg commit -m "added foo.txt" commit
    • 抓取共享的存储库: hg clone ssh://example.com//projects/hgrepo
    • 本地提交更改: hg -ci -m "adding a change"
    • 把更改推到服务器: hg push
    • 以补丁形式查看未处理的更新: hg incoming -p
    • 从服务器下载更新: hg pull
    • 应用更改: hg update
    • 合并冲突: hg merge
    • 合并两个不相关的远程存储库: hg pull -f ssh://example2.com//projects/hgrepo
  • Bazaar
    • 安装: sudo easy_install-2.5 bzr
    • 建立项目目录: mkdir bzrrepo; cd bzrrepo
    • 初始化项目: bzr init
    • 添加文件: touch foo.txt; bzr add foo.txt
    • 提交: bzr commit -m "added foo.txt" commit
    • 抓取共享的存储库: bzr branch bzr+ssh://example.com/projects/gitrepo
    • 本地提交更改: bzr -ci -m "adding a change"
    • 把更改推到服务器: bzr push
    • 从服务器下载更新: bzr pull
    • 应用更改: bzr update
    • 合并冲突: bzr merge
  • Git
    • 安装:下载最新的 tar 文件 http://kernel.org/pub/software/scm/
    • 建立项目目录: mkdir gitrepo; cd gitrepo
    • 初始化项目: git init
    • 添加文件: touch foo.txt; git add foo.txt
    • 提交: git commit -m "added foo.txt" commit
    • 抓取共享的存储库: git clone ssh://example.com/projects/bzrrepo
    • 本地提交更改: bzr -ci -m "adding a change" commit
    • 把更改推到服务器: bzr push
    • 从服务器下载更新: bzr pull
    • 应用更改: bzr update
    • 合并冲突: bzr merge

转换工具和与 subversion 的集成

这三种 DVCS 都能够把现有的 subversion 存储库轻松地转换为各自的格式,甚至可以在不同的 DVCS 之间进行转换。这使开发人员能够方便地试用 DVCS 或从一种 DVCS 转移到另一种 DVCS。

例如,对于 Mercurial,可以使用工具 hgimportsvn 和 hgpullsvn 与现有的 subversion 存储库通信,创建新的 hg 存储库和历史。tailor 工具是一种通用的存储库转换工具。

另一种有意思的试用方法是集成 DVCS 与现有的 subversion 存储库。对这种方法的详细讨论超出了本文的范围,但是 参考资料 给出了一些工具的链接,这些工具可以在 subversion 分支与 Git、Bazaar 和 Mercurial 之间进行双向操作。

第三方托管选项

如果开放源码或商业开发人员不希望或不需要管理自己的集中式 “集线器”,那么可以选用流行的托管站点托管自己的 Git、Bazaar 或 Mercurial 项目。对于 Mercurial,流行的免费和付费托管站点是 Bitbucket。对于 Git,可以使用 Github;对于 Bazaar,可以使用由 Canonical 发起的 Launchpad。

提示:“咖啡馆” Mercurial 工作流

图 1. 咖啡馆工作流
咖啡馆工作流

如果希望实现安全的特殊版本控制工作流,让两个开发人员可以在咖啡馆中通过无线网络一起工作,那么可以试试下面的方法。

第一个用户使用 Mercurial 创建一个存储库:

 mkdir /tmp/myhgrepo
cd /tmp/myhgrepo
hg init

然后,通过 Web 作为只读共享共享它:

 hg serve

第二个用户使用以下命令克隆这个存储库:

 hg clone http://example.com:8000

注意:这是另一台机器的 IP 地址或本地主机名。在 OS X 上,可以通过对 your-machine-name.local 使用 Bonjour 获得这一信息。

第二个用户进行他需要的更改,然后作为只读的 HTTP 共享提供他的存储库:

 http://example.com:8000

第一个用户对第二个用户的存储库拷贝执行 hg 拖操作:

 hg clone http://example2.com:8000

每个开发人员都是安全的,因为他们只在需要更新自己的本地文件系统时才对对方的存储库进行拖操作。

结束语

本文讨论了分布式版本控制能够提供的价值,比较了三种主流工具 Git、Mercurial 和 Bazaar 之间的差异。如果您不太熟悉版本控制,那么应该继续学习版本控制、钩子和插件以及它们能够提供的功能。

如果您是老手,那么应该试试这些工具,寻找最适合自己的工具。请通过 参考资料 中的链接详细了解各种分布式版本控制系统以及别人的使用经验。

参考资料

学习
  • DVCS overview
  • Tailor 是一种全面的版本控制迁移工具。
  • Mercurial 附带一个实用程序,可以在 svn 之间来回复制更改。
  • Bazaar 附带一组工具,它们可以从 svn 进行迁移。
  • Git 有几个工具。github 是一个流行的 Git 托管站点。
  • AIX and UNIX 专区:developerWorks 的“AIX and UNIX 专区”提供了大量与 AIX 系统管理的所有方面相关的信息,您可以利用它们来扩展自己的 UNIX 技能。
  • AIX and UNIX 新手入门:访问“AIX and UNIX 新手入门”页面可了解更多关于 AIX 和 UNIX 的内容。
  • AIX and UNIX 专题汇总:AIX and UNIX 专区已经为您推出了很多的技术专题,为您总结了很多热门的知识点。我们在后面还会继续推出很多相关的热门专题给您,为了方便您的访问,我们在这里为您把本专区的所有专题进行汇总,让您更方便的找到您需要的内容。
  • Open source:访问 developerWorks Open source 专区,这里有丰富的 how-to 信息、工具和项目更新,可以帮助您利用开放源码技术进行开发并将其用于 IBM 产品。
  • 随时关注 developerWorks 技术活动网络广播
  • Podcasts:收听 Podcast 并了解 IBM 技术专家的最新想法。
讨论

火龙果软件/UML软件工程组织致力于提高您的软件工程实践能力,我们不断地吸取业界的宝贵经验,向您提供经过数百家企业验证的有效的工程技术实践经验,同时关注最新的理论进展,帮助您“领跑您所在行业的软件世界”。
资源网站: UML软件工程组织