完整安装和启动(手动启动)

您可以安装完整的Data Collector压缩包并在所有受支持的操作系统上手动启动。

手动启动Data Collector时Data Collector将以运行启动命令时登录到命令提示符下的系统用户帐户身份运行。您也可以在运行命令时模拟其他用户帐户。

    1. 使用以下URL 从StreamSets网站下载完整的StreamSets Data Collector压缩包:https://streamsets.com/opensource 
    2. 将压缩包提取到所需位置。
    3. 对于生产环境,请配置用于存储配置、数据、日志和资源文件的目录,以使其异于$SDC_DIST(提取压缩包的位置)或Data Collector运行时目录。
      使用运行时目录之外的目录可以在Data Collector升级后启用目录的使用。
      对于开发或测试环境,可以使用$SDC_DIST运行时目录中的默认位置。但是,对于所有环境,StreamSets建议您使用运行时目录之外的目录。如果将默认值用于开发或测试环境,请确保启动Data Collector的用户对Data Collector运行时目录具有写权限。
      a.在$SDC_DIST运行时目录之外创建用于配置、数据、日志和资源文件的目录。
      b.在$SDC_DIST/libexec/sdc-env.sh文件中,将以下环境变量设置为新创建的目录:

      • SDC_CONF – Data Collector配置目录。
      • SDC_DATA – Data Collector管道状态和配置信息目录。
      • SDC_LOG – Data Collector日志目录。
      • SDC_RESOURCES – Data Collector运行时资源文件目录。
    4. 将所有文件从$SDC_DIST/etc复制到新创建的$SDC_CONF目录。
    5. 使用$SDC_DIST目录中的以下命令,以登录到命令提示符下的系统用户帐户运行Data Collector
      bin/streamsets dc

      或者,使用以下命令在后台运行Data Collector

      nohup bin/streamsets dc &

      使用以下命令以另一个系统用户帐户运行Data Collector

      sudo -u <user> bin/streamsets dc

       

    6. 要访问Data Collector UI,请在浏览器的地址栏中输入以下URL:
      http://<hostname>:18630/